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الفصل الأول: نظرة عامة على ذكاء الأعمالء والتحليلات» وعلم البيانات ب 


الفصل الثاني: التحليلات الوصفية :)١(‏ طبيعة البيانات» النمذجة الإحصائية, 
تصوير البيانات ..... 
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نبذة عن المؤلقين 
الفصل الأول: نظرة عامة على ذكاء الأعمالء والتحليلات» وعلم البيانات ا 





1-١‏ مقال افتتاحي: التحليلات الرياضية - حدود مثيرة e Ind‏ وفهم تطبيقات 
التحليلات . 





e Odonis بيئات الأعمال المتغيرة والاحتياجات المتطورة لدعم القرار‎ ١ 


..... تطور دعم القرار ا لمحوسب لعلم البيانات / التحليلات‎ ۴-١ 
إطار عمل ذكاء الأعمال‎ ٤-١ 








حالة عملية :١-١‏ شركة 59616 تساعد عملاءها من خلال لوحات المعلومات 
والتحليلات .. 





استعمال الوسائط المتعددة في ذكاء الأعمال 





0-١‏ نظرة عامة على التحليلات 





حالة عملية ١-؟:‏ شركة سيلفاريس ge» (Silvaris)‏ أعمالها باستخدام التحليل المرثي» 
وإمكانيات إعداد التقارير الفورية جم ج چ 





حالة عملية :"-١‏ شركة سيمنس Åi (Siemens)‏ التكلفة باستخدام تصوير البيانات ... 


حالة عملية :٤-١‏ تحليل الإصابات الرياضية 





حالة عملية :0-١‏ شركة ستيل بار (821 5]6»1) المتخصصة تستخدم التحليلات لتحديد 
تواريخ تنفيذ التزاماتها وفقاً للموارد المتاحة 
5-١‏ أمثلة على التحليلات في مجالات المختارة 








ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 
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الموضوع 
١-/ا‏ مقدمة موجزة لتحليلات البيانات الضخمة  et‏ 





حالة عملية Point à $ à Y‏ 06816 للطاقة تستخدم التحليلات الفورية للبيانات 
الضخمة لتحسين خدمة العملاء 
4-١‏ نظرة عامة على النظام البيئي للتحليلات 
9-١‏ خطة الكتاب ... 











٠١-١‏ مواردء وروابطء واتصال شبكة جامعة تيراداتا 





الفصل الثاني: التحليلات الوصفية :)١(‏ طبيعة البيانات» النمذجة الإحصائيةء تصوير 
البيانات ...... 





۲ مقال إفتتاحي: قيام ال 5113015531 بجذب وإشراك جيل جديد من 
مستخدمي الراديو باستخدام التسويق المبني على البيانات 


۲-۲ طبيعة البيانات 











حالة عملية :١-۲‏ شركة أجهزة طبية تضمن جودة المنتج مع توفير امال n‏ 


٤-۲‏ فن وعلم معالجة البيانات 








حالة عملية ؟-!: تحسين الاحتفاظ بالطلاب باستخدام التحليلات المعتمدة على 
البيانات .. 





0-١‏ النمذجة الإحصائية لتحليلات الأعمال 





حالة عملية :۳-١‏ مدينة كاري تستخدم التحلي لات لتحليل البيانات من أجهزة 
الاستشعار وتقييم الطلب والكشف عن المشكلات 





5-97 نمذجة الانحدار للإحصاءات الاستدلالية س 








حالة عملية :6-١‏ توقع نتائج لعبة وعاء 21044 - EEE‏ 


^ ذكاء الأعمال والتحليلات وعلم البيانات, منظور إداري 
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۷-۲ إعداد تقارير الأعمال 





حالة عملية ؟-0: انتهاء فيضان الورق في FEMA‏ . و 


... تصوير البيانات‎ A-Y 





حالة عملية ؟-1: ماكفارلان سميث يحسن رؤية الأداء التشغيلي باستخدام Tableau‏ 


~ Online 





۹-۲ الأنواع المختلفة للمخططات والرسوم البيانية 





Seems inris نشأة التحليلات اللطرئية‎ ٠١-7 





Y‏ الغلو مات د ج 





حالة عملية ۷-۲: فریق دالاس کاوہویز يحقق نتائج كبيرة مع تابلوه (تنهعاطة1) 
(Teknion) js4S3g‏ ..— 


حالة عملية ؟-6: تساعد التحليلات المرئية مورد الطاقة في عمل روابط أفضل سس 





الفصل الثالث: التحليلات الوصفية (9): ذكاء الأعمال ومستودعات البيانات .... 
٠-٣‏ مقال افتتاحي: استهداف الاحتيال الضريبي مع ذكاء الأعمال ومستودعات البيانات.. 


۲-۳ ذكاء الأعمال ومستودعات البيانات 





حالة عملية :١-*‏ خطة بيانات أفضل: تستفيد شركات الاتصالات الجيدة التأسيس 
من مستودعات البيانات والتحليلات؛ للبقاء على القمة في صناعة تنافسية ..... 








9-"ا عملية مستودعات البيانات .... 


cola £-Y‏ مستودعات البيانات 








....... )811.( تكامل البيانات وعمليات الاستخراج والتحويل والتنزيل‎ ٥-۳ 


حالة عملية ۲-۳: بریتش بتروليوم 8۴ لواد التشحيم تحقق نجاح 816$ ...... 





ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 
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Y‏ تطوير مستودع البيانات 
حالة عملية ؟-!:استخدام تحليلات تيراداتاالحلول 545 تَُسرٌ ع عملية تسليم البيانات الكبيرة 


۷-۳۴ قضايا تنفيذ عملية مستودعات البيانات 





حالة عملية :٤-۳‏ ۴0۷ يساعد على ربط وكالات الدولة في ولاية ميشغان ‏ 


۸-۳ إدارة مستودع البياناتء والمشكلات الأمنية» والاتجاهات اممستقبلية ...... 








#-9 إدارة أداء الأعمال 


حالة عملية ؟-0: 4412 تقوم بتحويل بنية ذكاء الأعمال التحتية وتحقق عائد 
استثمار بنسبة <٤۷‏ في ثلاث سنوات حيط 





٠۰-۳‏ مقياس الاداء 





. بطاقات الأداء المتوازنة‎ 1١-* 





۱۲-۴ ستة سيجما كنظام لقياس الأداء ‏ الع 





حالة عملية :1-١‏ بطاقة درجة رضا العملاء الخاصة ب Expedia-c011‏ 





الفصل الرابع: التحليلات التنبؤية :)١(‏ عملية, وطرق» وخوار زميات التنقيب ف البيانات... 


١-٤‏ مقال افتتاحي: قسم شرطة ميامي ديد يستخدم التحليلات التنبؤية للتنبؤ 





۲-٤‏ مفاهيم وتطبيقات التنقيب في البيانات 





حالة عملية :١-6‏ 77158 هي تعزيز لتجربة العملاء مع الحد من الاحتيال بالتنقيب 
في البيانات والتحليلات التنبؤية 





حالة عملية ٤-۲:احتفاظ‏ شركة 211 بذكاء وفعالية تحليلاتهاف القرن الحادي والعشرين.. 


ecc LOU تطبيقات التنقيب ف‎ ۲-٤ 





1۰ ذكاء الأعمال والتحليلات وعلم OLLI‏ منظور إداري 
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الموضوع 
حالة عملية ع-": التحليل التنبؤي والتنقيب في البيانات يساعد في وقف تمويل الإرهاب .. 


٤-٤‏ عملية التنقيب في البيانات 





حالة عملية :٤-٤‏ يساعد التنقيب في البيانات في أبحاث السرطان ...... 








٥-٤‏ طرق التنقيب ف البيانات 
حالة عملية :0-٤‏ تستخدم شركة å osib åsa Mado Influence Health‏ 
للتركيز على العوامل التي تؤثر بالفعل على قرارات الرعاية الصحية للأشخاص .ب 
5-6 أدوات برمجيات التنقيب في البيانات ات 





حالة عملية 1-6: التنقيب في البيانات ينتقل إلى هوليوود: توقع النجاح المالي للأفلام ب 


. مشكلات خصوصية التنقيب في البيانات» والخرافات» والأخطاء الفادحة‎ ۷-٤ 





حالة عملية 6-/!: توقع أماط شراء العملاء - s Target dab‏ 





الفصل الخامس: التحليلات التنبؤية (؟): تحليلات النص والويب ووسائل 
التواصل الاجتماعي ...... 
1-5 مقال افتتاحي: الآلة مقابل الإنسان على Jeopardy‏ قصة واتسون ... 
Y-0‏ نظرة عامّة على تحليلات النص والتنقيب في النص  Rn.‏ 
حالة عملية0-١:‏ مجموعة التأمين تعمل على تقوية إدارة ا مخاطر مع حل التنقيب في النص سس 
٠-٠٥‏ معالجة اللغات الطبيعية (NLP)‏ 














حالة عملية 0-؟: استخدام شبكات ©4810 التحليلات coded‏ مشاهدين جدد 
وتقييم التوقعات وإضافة القيمة للمعلنين في عام متعدد القنوات .... 
٠-٥‏ تطبيقات التنقيب في النص 








حالة عملية 0-: التنقيب للكشف عن الأكاذيب 





ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 
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الموضوع 

حالة عملية 5-0: إدراج العميل ضمن معادلة الجودة: تستخدم لينوفو 162070 
التحليلات من أجل إعادة التفكير في إعادة تصميمها 
0-0 عملية التنقيب في النص 











حالة عملية 0-0: مسح بحوث الأدبيات بالتنقيب في النص .... 
5-5 تحليل المشاعر ‏ 
حالة عملية 1-0: إنشاء تجربة رقمية فريدة لرصد اللحظات المهمة في وهبلدون سس 











5-/ نظرة عامّة على التنقيب في الويبب 


.... محركات البحٹ‎ A-0 








حالة عملية 0-/: فهم لماذا يؤدي التنازل عن عربات التسوق إلى زيادة مبيعات 
بمقدار ٠١‏ مليون دولار ... 5 
٥‏ التنقيب في استخدام الويب (تحليلات الويب) 








٠١-5‏ التحليلات الاجتماعية 





حالة عملية 8-0: فودكا تيتو تؤسس الولاء للعلامة التجارية بإستراتيجية اجتماعية 





الفصل السادس: التحليلات التوجيهية: التحسين والمحاكاة .... 
١-1١‏ مقال افتتاحي: منطقة فيلاديلفيا التعليمية تستخدم التحليلات التوجيهية 
لإيجاد حل أمثل لإبرام عقود خطوط سير الحافلات 
۲-٣‏ اتخاذ القرار بناءً على النموذج 
حالة عملية :١-5‏ النقل الأمثل للبيانات من الخادع 10077523 لشركة إكسون 
موبيل go ExxonMobil‏ خلال نظام دعم القرار 255 














حالة عملية ١-؟:‏ استخدام تطبيقات ذكاء الأعمال من قبل شركة إنجرام مايكرو 
s Ingram Micro‏ أجل اتخاذ قرارات التسعير . 





w‏ ذكاء الأعمال والتحليلات وعلم البيانات, منظور إداري 
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الموضوع 
٠‏ هيكل النماذج الرياضية لدعم القرار 
«sli e-1‏ وعدم «ll‏ والخطر ... axes‏ و 








حالة عملية 5-,: استخدام الخطوط الجوية الأمريكية نمذجة التكلفة اللازمة 
لتقييم عدم التأكد من عطاءات طرق الشحن ‏ 


0-1 نمذجة القرار باستخدام جداول البيانات 








حالة عملية :٤-١‏ استخدام بنسيلفينيا أدو Pennsylvania Adoption) gotës] gàs‏ 
82 <1) لنموذج جدول البيانات من أجل تحسين تطابق الأطفال مع M‏ 
حالة عملية 0-1: استخدام مؤسسة مترو ميلز أون وييلز تريجر فالي 
Exce1 lil (Metro Meals on Wheels Treasure Valley)‏ من أجل البحث 
عن خطوط السبر الى للتسليم 
7-1 تحسين البرمجة الرياضية 
حالة عملية 7-1: مساعدة موذج البرمجة العددية المختلطة لمركز جامعة تينيسي 
6556 ممع" الطبي في وضع جدول مواعيد الأطباء 
۷-1 الأهداف المتعددة وتحليل الحساسيةء وتحليل «ماذا - لو» والبحث عن 

















5-1 مقدمة في المحاكاة ... 








حالة عملية :۷-١‏ محاكاة آثار تدخلات الالتهاب الكبدي 8 ..... 
حالة عملية 4-1: استخدام شركة كوزان 005353 المحاكاة من أجل تحسين سلسلة التوريد 





٠١-1‏ المحاكاة التفاعلية المرئنية 





حالة عملية 9-1: تحسين قرارات جدولة محل العمل من خلال الترددات اللاسلكية 
RFID‏ التقييم القائم على المحاكاة 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 
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الموضوع 
الفصل السابع: مفاهيم وأدوات البيانات الضخمة 
۷ مقال افتتاحي: تحليل حركة العملاء في شركة اتصالات باستخدام طرق البيانات 
الضخمة .. 











۲-۷ تعريف البيانات الضخمة 
حالة عملية /ا-١:‏ بيانات بديلة لتحليلات أو توقعات السوق ... 





۳-۷ أساسيات تحليلات البيانات الضخمة .. m A EE‏ 





حالة عملية ۲-۷: بنك توب فایف انفستمنت 10p Five 1"۷es1 "e2‏ يحقق 
التوصل إلى مصدر واحد للحقيقة 





٤-۷‏ تقنيات البيانات الضخمة 





حالة عملية /ا-: حل البيانات الضخمة الخاص 2 eBay‏ 





حالة عملية :٤-۷‏ فهم جودة ودقة معلومات دعم الرعاية الصحية على mme UP‏ 





/ا-0 البيانات الضخمة ومس تودعات البيانات 
1-۷ موردو ومنصات البيانات الضخمة . 
حالة عملية /ا-0: استخدام وسائل التواصل الاجتماعي للتنبؤ الفوري بنشاط الانفلونزا... 
حالة عملية -1: تحليل أنماط المرض من مستودع بيانات السجلات الطبية 
۷-۷ البيانات الضخمة وتحليلات التيار .. اليد ممه 











A-V‏ تطبيقات تحليلات التيار. 





حالة عملية /ا-/ا: استخدام 5216510506 لتيار البيانات لتحسين قيمة العميل ىب 
الفصل الثامن: الاتجاهات المستقبلية والخصوصية والاعتبارات الإدارية في التحليلات ... 
١-8‏ مقال افتتاحي: تحليل بيانات الاستشعار يساعد سيمنس (51672685) على 
تجنب أعطال القطارا أ 





1 ذكاء الأعمال والتحليلات وعلم البيانات. منظور إداري 
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8-" إنترنت الأشياء . 
حالة عملية :١-8‏ شركة زوارق 511761110012 تستخدم تحليل البيانات الفوري 
لإخطار المتسابقين والمشجعين 
حالة عملية 4-!: 455 dài KG LS Joel (31,5 Rockwell Automation‏ 
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موجز تمهيدي: 

لقد أصبح تحليل البيانات هو ال منهج الرائد في تقنية العقد الحالي. وتقوم شركات مثل 
أي بي SAP) à 43! odds (BM) el‏ وإس إيه إس (545). وتيراداتا JSh;sls «Teradata)‏ 
(Microsoft) «5 155, $5U.5 (Oracle)‏ ودیل (Dell)‏ وغيرها من الشركات بإنشاء وحدات 
تنظيمية جديدة تركّز على التحليلات التي تساعد الشركات على أن تصبح 351 فعاليةً وكفاءةً في 
عملياتها. ويستخدم صانعو القرار مزيدًا من الأدوات المحوسبة لدعم أعمالهم؛ بل إِنَّ المستهلكين 
يستخدمون أدوات تحليليةء بشكل مباشر أو غير مباشر؛ من أجل اتخاذ قرارات بشأن الأنشطة 
ا معتادة كالتسوق والصحة/ الرعاية الصحية والسقر والترفيه. وقد تطوٌّر مجالا ذكاء الأعمال 
81 وتحليلات الأعمال 84 بسرعة هائلة ليصبحا أكثر تركيرًا على التطبيقات المبتكرة لاستخلاص 
المعلومات من تيارات البيانات التي مم يكن من الممكن الحصولٌ عليها فى وقت ما في الماضي أو كان 
تحليلها على نحو أقل بكثير حتى باستخدام أي وسيلة متطورة في هذا الوقت. وتظهر التطبيقات 
الجديدة يوميًا في مجال الرعاية الصحية» والرياضة» والسغرء والترفيه, وإدارة سلاسل التوريد, 
والمرافق» وكل صناعة تقريبًا قد تتخيلها. ومن ثَمّ أصبح مصطلح التحليلات سائدًا وتطوّر بالفعل 
إلى مصطلحات أخرى مثل علم البيانات وهو أحدث تجسيد للتعلّم العميق وإنترنت الأشياء. 

på isg‏ هذه الطبعة منظورًا إدارياً لتحليل الأعمال, بدءًا من التحليلات الوصفية (مثل: 
طبيعة البيانات» والنمذجة الإحصائيةء وتصوير البيانات» وذكاء الأعمال) لينتقل إلى التحليلات 
التنبؤية (مثل: التنقيب في البيانات» والتنقيب في النص/ الويبء والتنقيب في وسائل التواصل 
الاجتماعي)» ومن ثَمّ إلى التحليلات التوجيهية (مثل: التحسين والمحاكاة). وانتهاءً بالبيانات 
الضخمة: والاتجاهات امس تقبليةء والخصوصية» والاعتبارات الإدارية. ويدعم الكتابُ موقع 
x51! &U3S5 .(pearsonhighered.com/sharda) «55‏ المستقل <دمء >لههطأطوقل. كما 
سنوفر روابط إلى برامج تعليمية من خلال قسم خاص لواقع الويب. 

إن الغرض من هذا الكتاب؛ هو تزويد القارئ بهذه التقنيات التي تُسمّى عمومًا تحليلات 
الأعمال أو علم البيانات؛ ولكنها كانت معروفةً من قبل بأسماء أخرى. ويعرض هذا الكتاب 
أساسيات الأساليب والطريقة التي يتح من خلالها إنشاء هذه الأنظمة واستخدامها. ونتبع في 
ذلك نهج 8115 لتقديم هذه المواضيع: Luse) Experiences (bys) Exposure‏ 3 
ا(لاستكشاف). ويوفر الكتابٌ في المقام الأول التعرّض بلختلف أساليب التحليلات 
وتطبيقاتها. والفكرة هي أن الطالب سوف يكون مصدر إلهام لتعلّم كيفية استخدام المنظمات 
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الأخرى للتحليلات؛ من أجل اتخاذ القرارات أو للحصول على ميزة تنافسية. ونعتقد أن مثل 
هذا التعرض با يحدث باستخدام التحليلات وكيفية تحقيقه هو المكون الرئيس للتعلم بشأن 
التحليلات. وفي وَصْف الأساليب» نعرض كذلك أدوات البرمجيات المحدّدة التي يمكن استخدامها 
لتطوير مثل هذه التطبيقات. ولا يقتصر الكتاب على أداة برمجية واحدة. حتى يستطيع الطالب 
تجريب هذه الأماليب باستخدام أيّ عدد من أدوات البرمجيات المتاحة. كما نقدّم اقتراحات 
مُحدَّدة في كلّ فصل حتى يتسنى للطالب والأمتاذ استخدامٌ هذا الكتاب الذي يحتوي على 
العديد من أدوات البرمجيات المختلفة. وسيتضمّن موقع الويب المصاحب لكتابنا أدلة لبرمجيات 
محددة. ولكن هكن للطلاب اكتساث الخبرة في هذه الأساليب بطرق عديدة ومختلفة. sols‏ 
JS od Ol dab‏ من التعرض والتجريبء ويحفزا القراء على استكشاف إمكانات هذه الأساليب 
كل في مجاله. ولتسهيل مثل هذا الاستكشاف؟؛ نقوم بتضمين التجارب التي توجههم إلى شبكة 
جامعة تيراداتا 16120218" وغيرها من المواقع؛ والتي تشمل تدريبات قائمة على عمل الفريق 
إذا لزم الأمر. وسنُس لط الضوء أيضاً على التطبيقات الجديدة والمبتكرة التي نتعلمها على موقع 
الكتاب على شبكة الإنترنت. 

وتركز معظم التحسينات المحدّدة التي أُدخلّت في هذه الطبعة الرابعة على أربعة مجالات 
هي: إعادة التنظيم» والفصول الجديدة وتحديث المحتوىء وتركيز أكثر وضوحاً. وعلى الرغم من 
التغييرات العديدة؛ فقد حافظنا على الشمولية وسهولة الاستخدام التي جعلت الكتاب من الكتب 
الرائدة في السوق. وأخيرًا؛ نقدم موادًا دقيقةً ومحدثةٌ غير متوفرة في أي نص آخر. 


ما الجديدٌ في الطبعة الرابعة؟ 


ولأننا نهدف إلى تحسين النص؛ قمنا في هذه الطبعة بإعادة تنظيم جوهرية للنص نركّز 
من خلالها على تحليلات الأعمال. وقد تمّ تنظيمُ هذه الطبعة لتتضمن ثلاثة أنواع رئيسة من 
تحليلات الأعمال (وهي: الوصفية» والتنبؤية» والتوجيهية). وتحتوي الطبعة الجديدة على العديد 
من الإضافات التي تتناسب مع التطورات الحديثة» وقد تمّ حذف المحتويات التي أصبحت لا 
تتلاءم مع هذه التطورات. وقد أجريّت التغييراثٌ الرئيسية التالية: 
- التنظيم الجديد: jis‏ هذا الكتابٌ بثلاثة أنواع من التحليلات: الوصفية, والتنبؤية» والتوجيهية؛ 
وهو التصنيف الذي يروّج له معهدٌ بحوث العمليات وإدارة العلوم إنفورمز (12058013/5). 
يقدّم الفصل الأول ذكاء الأعمال والتحليل مع التركيز على تطبيقاتهما في العديد من الصناعات. 
كما يتضمّن هذا الفصل كذلك لمحةٌ عامةٌ عن النظام البيئي للتحليل لمساعدة المستخدم على 
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استكشاف جميع الطرق المختلفة التي يمكن المشاركة فيها وتنميتها في بيئة التحليلات. ويلي 

ذلك نظرةٌ عامة على الإحصاءات وأهمية البيانات والتحليلات الوصفية/ التصوير في الفصل 

الثاني. ويتناول الفصل الثالث مستودع البيانات وأسُس البيانات بما في ذلك المحتوى المُحدَّتْ؛ 

وخصوصًا بحيرات البيانات. ويغطي الفصل الرابع التحليلات التنبؤية. أمًا الفصل الخامس 

فيوشّع من نطاق تطبيق التحليلات إلى النص وا مواقع الإلكترونية ووسائل التواصل الاجتماعي. 

ويتناول الفصل السادس التحليلات التوجيهية؛ وخاصة البرمجة الخطية والمحاكاة. وهو محتوى 

جديد تمامًا بهذا الكتاب. ويقدّم الفصل السابع أدوات ومنضَّات البيانات الضخمة. ويُختتم 

الكتابٌ بالفصل الثامن والاتجاهات والمواضيع الحديثة الظهور في تحليلات الأعمال بما في ذلك 

تحليلات gigh‏ وإنترنت الأشياء والاعتبارات الخصوصية/ الأخلاقية في التحليلات. وتعترف 

مناقشة النظام البيئي التحليلي بالتحليلات التوجيهية كذلك. 

- الفصول الجديدة: ّت إضافة الفصول التالية: 

- الفصل الثاني: التحليلات الوصفية :)١(‏ طبيعة البيانات» النمذجة الإحصائيةء وتصوير 
البيانات ويهدف هذا الفصل إلى وضع حجر الأساس للدراسة التحليلية عن طريق فهم 
شامل لطبيعة البيانات» وهو العنصرٌ الرئيس لأيّ دراسة تحليلية. ويلي ذلك» عرض 
النمذجة الإحصائية كجزء من التحليلات الوصفية. ولقد أصبح تصويرٌ البيانات جزءًا 
شائعًا من أي تقرير عن الأعمال و / أو أي مشروع تحلياي وصفي؛ وبالتالي نقوم بشرح 
ذلك بالتفصيل في هذا الفصل. ونع زز الفصل بالعديد من الحالات والأمثلة في عام 
الواقع <۷٥(‏ من المواد الجديدة). 

- الفصل السادس: التحليلات التوجيهية: التحسين وا محاكاة. ويقدّم هذا الفصل Šola‏ 
تحليلية وصفيةٌ لهذا الكتاب. ويركٌز الفصل على نمذجة التحسين في إكسيل باستخدام 
تقنيات البرمجة الخطية. كما يقدَّم مفهوم المحاكاة. والفصل هو نسخةٌ محدثةٌ لمواد 
فصلين في كتابنا 1255, الطبعة العاشرة. وهو بالنسبة لهذا الكتاب فصلٌ جديدٌ تمامًا 
)439 مواد جديدة). 

- الفصل الثامن: الاتجاهات المستقبلية, والخصوصية: والاعتبارات الإدارية في التحليلات 
ويتناول هذا الفصل العديد من الظواهر الجديدة التي تغيّر أو من المحتمل أن تغير 
التحليلات. حيث يتناول تحليلات الجغرافيا المكانيةء وإنترنت الأشياء وتحدينًا كيا 
للمواد المتعلقة بالتحليلات المستندة إلى الحوسبة السحابية. كما يقوم بتحديث 
ما تناولته الطبعة الأخيرة بشأن الاعتبارات الأخلاقية والعملية 4۷١(‏ مواد جديدة). 
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- الفصول المنقحة: وقد تمّ تنقيحٌ جميع الفصول الأخرى وتحديثها كذلك. وفيما يلي ملخض 

للتغيرات في هذه الفصول الأخرى: 

- الفصل الأول: نظرة عامة على ذكاء الأعمالء والتحليلات» وعلم البيانات: ّت إعادة كتابة 
هذا الفصل وتوسعته بشكل كبير؛ بحيث يُفتتح بمقالة قصيرة جديدة تغطي تطبيقات 
متعددة من التحليلات في مجال الرياضة. وهو يقدّم الأنواع الثلاثة من التحليلات على 
النحو الذي اقترحته مؤسسة إنفورمز (1215078245): التحليلات الوصفية» التنبؤية, 
والتوجيهية. وكما أشرنا سابقاً؛ فإن هذا التصنيف يُستخدّم في التوجيه لإعادة تنظيم 
كاملة للكتاب نفسه (المحتوى السابق؛ ولكن بشكلٍ جديد). ثم يتضمن عدة أمثلة 
جديدة من التحليلات في مجال الرعاية الصحية وفي قطاع تجارة التجزئة. وأخيرا؛ فإنه 
يُختتم بتغطية مُوسّعة ومُحدَّثة بشكلٍ كبير للنظام البيئي للتحليلات ea‏ الطلاب Dos‏ 
باتساع نطاق صناعة التحليلات وعلم البيانات (حوالي >1١‏ مواد جديدة). 

- الفصل الثالث: التحليلات الوصفية (۲): ذكاء الأعمال ومستودع البيانات: dis‏ هذا 
الفصل فصلا قدا أضيف إليه بعص الأقسام الفرعية الجديدة (مثل: بحيرات البيانات) 
وحالات جديدة (حوالي “٠‏ مواد جديدة). 

- الفصل الرابع: التحليلات التنبؤية :)١(‏ عمليةء وطرق» وخوارزميات التنقيب في 
البيانات. وهذا أيضاً فصلٌ قديمٌ مع تنظيم/ تدفق جديد للمحتوى وبعض الحالات 
الجديدة (حوالي ٠١‏ مواد جديدة). 

- الفصل الخامس: التحليلات التنبؤية (؟): تحليلات النصء والويب» ووسائل التواصل 
الاجتماعي وهو فصل قديم مع تنظيم/ تدفق جديد للمحتوى وبعض الحالات الجديدة 
ZYO (Moz)‏ مواد جديدة). 

- الفصل السابع: مفاهيم وأدوات البيانات الضخمة: كان هذا الفصل هو الفصل 
السادس في الطبعة السابقة. وقد تمّ تحديثه بمقدمة افتتاحية مختصرة وحالات 
جديدة: وتغطية لتيراداتا أستر (©]485 (Teradata‏ ومواد جديدة تتعلق بالبيانات 
البديلة (حوالي 70 مادة جديدة). 

- فريق تأليف مجدد: استنادً! إلى المحتوى المتميز الذي قام بإعداده مؤلفو الطبعات السابقة 
euis elá (Kings Deleng Shardas Turban)‏ هذه الطبعة Ramesh Sharda ja js‏ 
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وDelen .Dursun‏ وقد عمل الأخیران على نطاق واسع في التحليلات بما لهما من كفاءة 
في المجال الصناعي فضلاً عن الخبرة البحثية. 
- طباعة ملونة: إننا سعداء حقاً أن يظهر هذا الكتاب بالألوان. وحتى الأشكال التي وردت في 
النسخ السابقة أعيد رسمها حتى تتمتع بميزة الألوان. إنَّ استخدام اللون يُعرْز العديد من 
الأمثلة التصويرية والمواد الأخرى كذلك. 
- موقع ويب مُحدّث ونشط: يكن لقراء هذا الكتاب الآن الوصول إلى موقع على شبكة الإنترنت 
يشتمل على روابط خاصة بالأخبارء والبرمجيات» والبرامج التعليمية. وحتى مقاطع فيديو يوتيوب 
ذات الصلة بالمواضيع التي يغطيها الكتاب. وهذا الموقع سوف یکون -dssbibook.com ( lea‏ 
- محتوى مُتقّح ومُحدَّتْ: لقد استهللنا جميع الفصول تقريبًا بمقدمات تستند على القصص والأحداث 
الجارية. وبالإضافة إلى ذلك؛ تمّ تحديث الحالات العملية في جميع فصول الكتاب لتشمل الأمثلة 
الحديثة لتطبيقات أساليب/ نماذج معينة. وقد تمت إضافة روابط موقع ويب جديدة في جميع 
فصول الكتاب. كما حذفنا العديد من الروابط وا مراجع القديمة. وأخيراً؛ فقد أوردنا في معظم 
الفصول تدريبات ومهام جديدة على الإنترنت» وأسئلة مناقشة في جميع فصول الكتاب. 
- روابط إلى شبكة جامعة تيراداتا (1:1723): وتتضمن معظم الفصول روابط جديدة إلى شبكة 
جznlة .(teradatauniversitynetwork.com) lll‏ 
- عنوان الكتاب: وكما هو واضح بالفعل؛ فقد تغير عنوان الكتاب وتركيزه بشكل كبير. 
- دعم البرمجيات: يوفر موقع 0۸ا۲ على شبكة الإنترنت دعم البرمجيات دون أي رسوم. كما 
يوفر روابط إلى التنقيب في البيانات مجانًا وغيرها من البرامج. وبالإضافة إلى ذلك؛ يوفر الموقع 
تدريبات على استخدام مثل هذه البرامج. 
- الباقة الإضافية :www.pearsonhighered.com/sharda‏ ,| مجموعة شاملة ومرنة من 
الدعم التقني لتعزيز تجربة التعليم والتعلم. كما تتوفّر المواد الإضافية لكل من الطالب 
والمدرب على موقع الكتاب :pearsonhighered.com/sharda 41s 3$JMl‏ 
-١‏ دليل المدرب: يتضمّن دليلٌ المدرب أهداف pled‏ بكل فصلء واقتراحات التدريس 
(يمافي ذلك تعليمات للمشاريع). ويتوفر دليلٌ المدرب في قسم هيئة التدريس في 
-pearsonhighered.com/sharda‏ 
؟- ملف بند الاختبار وبرنامج 5ع16546: إن ملف بند الاختبار عبارة عن مجموعة 
شاملة من أسئلة (صح / خطأ). وأسئلة الاختيار المتعدد. واملأً الفراغ وأسئلة مقالية. 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري v"‏ 


موجز تمهيدي 


ويتم تصنيف الأسئلة حسب مستوى الصعوبةء ويّشار إلى الإجابات برقم صفحة الكتاب 
التي توجد بها. ويتوفّر ملف بند الاختبار في -TestGeng Microsoft Word‏ ویتوفر 
www.pearsonhighered.com/ j Pearson Education رlبتخا 4 4453 gab»‏ 
irc‏ ويتوافق البرنامج مع كل من الحاسب الشخصي وأجهزة MAC‏ ويتمٌ تنزيله مع 
جميع أسئلة ملف بند الاختبار. ويمكنك أن تقوم يدوياً أو عشوائياً بعرض أسئلة الاختبار 
والسحب والإسقاط لإنشاء اختبار. ويمكنك إضافة أو تعديل أسئلة بنك الاختبار حسب 
الحاجة. ويتم تحويل برمجية TestGens‏ حتى يمكن استخدامها في ds‏ من BlackBoard‏ 
.Angelg D2Ls Moodles WebCT‏ 5.69 العثور على هذه النسخ على موقع 
Respond us 3 TestGen eb bgu 5$. .pearsonhighered.com/sharda‏ 05-5 
الاطلاع على -www.respondus.com‏ 

- شرائح باوربوينت: تتوفر شرائح باوربوينت التي تنميز بخاصية الإضاءة؛ la‏ على 
المفاهيم الأساسية في النص. ويمكن لأعضاء هيئة التدريس تنزيل شرائح باوربوينت من 
.pearsonhighered.com/sharda‏ 


شكر وتقدير: 

pis‏ العديدٌ من الأفراد اقتراحات وانتقادات منذ نشر الطبعة الأولى من هذا الكتاب. وقد 
شارك العشراتٌ من الطلاب في الاختبارات الصفية مختلف الفصول والبرامج والمشكلات وساعدوا 
في جمع المواد. ولا يمكن ذكر اسم كلّ من شارك في هذا المشروع؛ ولكننا abo‏ الشكر لهم جميعاً. 
كما yazdi pá‏ مساهمات كبيرة» هؤلاء يستحقون تقديراً خاصًاء 

Mal‏ نقدَّر جهود الأفراد الذين قاموا بمراجعات رسمية للطبعات من الأولى حتى الثالثة 
(الانتماءات المدرسية اعتباراً من تاريخ المراجعة): 
- آن أكسوت» كلية مجتمع بيدمونت المركزية. 
- باي أرينز جامعة دريكسل. 
- أندي بورشرز» جامعة ليبسكومب. 
- رائجيت بوسء جامعة نيو مكسيكو. 
- مارق كروسلاند. جامعة أمريكا الوسطى الناصرية. 
- كورت إنجمان» كلية أيونا. 


v‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


موجز تمهيدي 


- بديع فرح» جامعة ميشيغان الشرقية. 
- غاري فارار» كلية كولومبيا. 
- جيري فيرميستادء معهد نيو جيرسي للتكنولوجيا. 
- كريستي م. فولرء جامعة لويزيانا التقنية. 
- مارتن غروسمان» كلية بريدج ووتر الحكومية. 
- جهانکیر کرهي» جامعة کولورادوء دنفر. 
- هوي لي» جامعة ميشيغان الشرقية. 
- ناتالي نازارينكوء جامعة نيويورك فريدونيا الحكومية. 
- جو إنج لي بارتريدج» جامعة كونيتيكت الحكومية المركزية. 
- غريغوري روزء جامعة واشنطن الحكوميةء فانكوفر. 
- خواجة سعيد, جامعة ويتشيتا الحكومية. 
- كالا تشاند سيل جامعة لويولا ماريماونت. 
- جوشوا س. وايت» دكتوراهء جامعة نيويورك الحكومية معهد الفنون التطبيقية. 
- روجر ويلسونء جامعة فيرمونت الحكومية. 
- فنسنت يوء جامعة ميسوري للعلوم والتكنولوجيا. 
- فان تشاوء جامعة ساحل خليج فلوريدا. 

ونقدّر أيضاً جهود الأفراد الذين قاموا بمراجعات رسمية لهذا النص وكتابنا الآخر 255 - ذكاء 
الأعمال والتحليلات: نظم دعم اتخاذ القرارء الطبعة العاشرة. بيرسون للتعليم, "11١لام.‏ 

ثانياً أسهم العديدٌُ من الأفراد مواد في النص أو المواد الداعمة. وقد قدّمت سوزان باسكن 
من تيراداتا والدكتور ديفيد شريدر مساعدةٌ خاصة في تحديد المحتوى الجديد لكل TUN gs‏ 
وتيراداتا للكتاب وترتيب الأذونات لنفس الغرض. كما أسهم الدكتور ديف شريدر في افتتاح 
المقالة القصيرة للكتاب. تضمّنت هذه المقالة القصيرة أيضاً مواد طوّرها الدكتور أشيش جوبتا 
من جامعة أوبورن وجاري ويلكيرسون من جامعة تينيسي تشاتانوجا. وسوف توفر مقدمة 
رائعة للتحليلات. نشكر أيضاً 181801315 على إذنهم بتسليط الضوء على المحتوى من 
الواجهات. كما نعترف بدور الأفراد التالية أسماؤهم في المساعدة في تطوير هذا الإصدار من 
الكتاب؟ وهم: بانكوش كالجوتراء وبراسون ماثورء وروبيش أجاروال» وشوبهام سينغ؛ ونان ليانغ» 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري yr‏ 


موجز تمهيدي 


وجاكوب بيرسونء وكينزي كليميرء وإيفان مورليت (وجميعهم من جامعة أوكلاهوما الحكومية). 
وقد قام ‘olg «Teradata Aster (3 à‏ مارك أووت بتوفير المواد اللازمة للمقالة الافتتاحية 
للفصل السابع. إذ يتم تكييف مواد Aster‏ &( الفصل ۷ من أدلة التدريب الأخرى التي طوّرها 
جون ثوما وجريج بيثاردي. كما قاد الدكتور برايان ليكلايرء مدير قسم المعلومات في شركة 
38 بمساهمات من العديد من دراسات الحالة الصحية الواقعية التي طوّرها فريقه في 
.Humana‏ وأسهم ابهيشيك راني من ۷٤٥۲۲۵۲٩۸‏ برؤيته للتحليلات في ki‏ بيع التجزئة. 
كما نتوجه بالشكر والتقدير للدكتور ريك ويلسون على التدريبات الممتازة لتدريس وممارسة 
مهارات البرمجة الخطية في 8:<1. كما سمح لنا مات تارك بتكييف مواد النظام البيئي لإنترنت 
الأشياء الخاصة به. ويقرٌ راميش بالمساعدة التي قدَّمتها ابنته» رشي شاردا سن في تحرير النسخ. 
بالإضافة إلى ذلك؛ قدَّم Eb‏ الدكتوراه وزملاؤنا من الباحثين التالي أسماؤهم محتوّى أو نصيحةٌ 
ودعمًا للكتاب بعدة طرق مباشرة وغير مباشرة: 
- أسيل أوزتيكينء جامعة ماساتشوستس - لويل. 
- إيئيس إريارسويء جامعة سيهير. 
- حامد مجيدي زولبانين» جامعة بول الحكومية. 
- أمير حسن زاده جامعة رايت الحكومية. 
- سوبافيتش (فون) بنجنات» جامعة داكوتا الشمالية الحكومية. 
- كريستي فولرء جامعة بويز الحكومية. 
- دانييل أسامواه جامعة رايت الحكومية. 
- سليم زايم» جامعة إسطنبول الفنية. 
- نيهات كاساب» جامعة سابانسي. 

ثالث بالنسبة للنسخة السابقة. نقر مساهمات ديفيد -(DA Software Group, Inc.) gi‏ 
ومن بين المساهمين الأساسيين الآخرين في الإصدار السابق جي أرونسون (جامعة جورجيا)» والذي 
كان مؤلقًا مشاركاء والمساهم في فصل مستودعات البيانات؛ ومايك جول (جامعة أريزونا الحكومية» 
والتي تمّ إدراجُ إسهاماتها في الفصل ١؛‏ وكذلك في بي ليانج (جامعة صن - يت سنء تايوان)» والذي 
أسهم هواد حول الشبكات العصبية ف الإصدارات السابقة. كما تعاونت جودي لانج معنا جميعًا في 
توفير التحرير» وقادتنا خلال المشروع بأكمله في الإصدار الأول. 
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موجز تمهيدي 


sul;‏ تعاون العديدٌُ من الموردين من خلال توفير دراسات الحالة و / أو برمجيات العرض 
التوضيحي للإصدارات السابقة وهم: أكسيوم (ليتل روك أركنساس)ء برمجيات كاليفورنيا العلمية 
(نيفادا سيتيء كاليفورنيا) كاري هاروين من تطوير كاتاليست (يوكا فاليء كاليفورنيا)» آي بي إم 
(سان کارلوس» کالیفورنیا)» شركة دي إس جروب. (جرينيتش» كونيكتيكت)». جريجوري بياتيتسكي 
-KDnuggets.com (2 35:05‏ جاري لين من .Neur0 Dine si 01 11٥‏ (جاینیسفیل» فلوریدا)» 
برمجیات بالیساد bá)‏ نيويورك)» برومیسد لاند للتقنیات (نیو هافن» کونیکتیکت) نظم 
سالفورد (لا جولاء كاليفورنيا)» سينس الشبكات (نيويورك» نيويورك)» جاري ماينر من شركة ستات 
سوفت» (تولساء أوكلاهوما)» شركة وارد سيس تمز جروبء إنك (فريدريكء ميريلاند)» شركة نظم 
آيديا فيشرء (إيرفينجء کالیفورنیا)» ونظم ورد تك (أورينداء كاليفورنيا). 

خامساً شكرٌ خاص لشبكة جامعة تيراداتا وخاصة سوزان باسكنء مديرة البرنامج؛ وهيوج 
واتسون الذي أسّس شبكة جامعة تيراداتاء ومايكل جولء وبارب ويكسوم؛ وماري جروس على 
تشجيعهم لنا على ربط هذا الكتاب بشبكة جامعة تيراداتا وتوفير مواد مفيدة له. 

أخيراً؛ نثني على فريق بيرسون: سامانتا لويس» التي عملت معنا على هذه المراجعة وقامت 
بتنظيم الإخراج الملون للكتاب؛ وفريق الإنتاج» آن بوليدى وريفاتي فيس واناثان والموظفون في 
سينفيوء الذين حؤّلوا المخطوطة اليدوية إلى كتاب. 


نود أن نشكر كلّ هؤلاء الأفراد والشركات. فبدون مساعدتهم ما كان إنشاء هذا الكتاب ممكنًا. 


راميش شاردا 
دورسون ديلن 
إفرايم توربان 


* لاحظ أن روابط موقع الويب ديناميكية؛ فبمجرد مثول هذا الكت اب للطباعةء تم التحقق gens Ol Qa‏ 
مواقع الويب المذكورة نش طة وصالحة. ولكن في بعض الأحيان تتغير أو تقف مواقع الويب المشار إليها في النص 
بسبب تغيير الشركات لأسمائهاء أو قد يتم شراؤها أو بيعها أو دمجها أو فشلهاء وفي أحيان أخرى تكون مواقع 
الويب معطلةً للصيانة أو الإصلاح أو إعادة التصميم. وفي حين أنَّ معظم المنظمات قد أسقطت البادئة «0/» 
من مواقعها؛ فإنَّ البعض الآخر لا يزال يستخدمها. إذا واجهت مشكلةٌ في الاتصال بموقع ويب تم الإشارة إليهء 
فضلاً تحلّى بالصبر وقم ببساطة بتشغيل بحث الويب ممحاولة تحديد الموقع الجديد؛ إذ إنه في معظم الأوقات يمكن 
العثورٌ على الموقع الجديد بسرعة. نعتذر مقدماً عن هذا الإزعاج. 
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موجز تمهيدي 


ذكاء الأعمالء والتحليلات» وعلم البيانات - منظور إداري: 


يتناول هذا الكتاب مجموعة من تقنيات الحاسب التي تدعم العمل الإداري؛ وبشكل أساسي 
صنع القرار. وقد كان لهذه التقنيات أثر عميق على إستراتيجية الشركة وأدائها وقدرتها التنافسية. 
وتُسمى هذه التقنيات مجتمعةً ذكاء الأعمال وتحليلات الأعمال وعلم البيانات. وعلى الرغم من 
مناقشة تطور المصطلحات, يتم استخدام هذه الأسماء أيضاً بالتبادل. ويروي هذا الكتاب قصصًا 
عن كيفية توظيف الأفراد الأذكياء لهذه التقنيات لتحسين الأداء والخدمة والعلاقات في الأعمال 
والحكومات والعوام غير الربحية. 


n‏ ذكاء الأعمال والتحليلات وعلم البيانات. منظور إداري 


TV 


ثُبذة عن المؤلفين: 

- راميش شارد! 52542 :Ramesh‏ (حاصل على درجة ماجستير إدارة الأعمال» والدكتوراهء 
من جامعة ويسكونسن - ماديسون)» وهو نائب العميد لبرامج البحث والخريجينء وعضو في 
واتسون / كونوكوفيليبس» وأستاذ أعضاء مجلس الجامعة للعلوم الإدارية ونظم المعلومات 
في مدرسة سبيرز للأعمال بجامعة أوكلاهوما الحكومية (0517). قام بالتأسيس والإشراف 
على درجة الدكتوراه في إدارة الأعمال في برنامج مديري التنفيذ. وقد تمّ نشرٌ حوالي ٠٠١‏ 
ورقة تصف أبحاثه في كبرى ال مجلات» ما في ذلك بحوث العمليات» وعلم الإدارة. وبحوث 
نظم المعلومات» ونظم دعم القرارء ومجلة نظم المعلومات الإدارية. كما قام بتأسيس AIS‏ 
© على أنظمة دعم القرار وإدارة المعرفة (5161054). يعمل الدكتور شاردا في العديد 
من مجالس التحريرء ما في ذلك مجلة علوم القرارء ونظم دعم القرارء وقاعدة بيانات 
4 . قام بتأليف وتحرير العديد من الكتب النصية والكتب البحثيةء كما يشارك في 
تحرير العديد من Springer ål sulu oS‏ (وهي سلسلة متكاملة في نظم المعلومات» 
وواجهات بحوث العمليات/ علوم الحاسب» وسجلات نظم المعلومات). ويش غل حالياً 
منصب المدير التنفيذي لشبكة جامعة تيراداتا. وتتمثل اهتماماته البحثية الحالية في نظم 
دعم القرار وتحليلات الأعمال وتقنيات إدارة الحمل الزائد للمعلومات. 

- دورسون ديلن 226165 دای 2: dole)‏ على درجة الدكتوراه. من جامعة أوكلاهوما 
الحكومية) وهو عضو سبيرز إندويد في إدارة الأعمالء وعضو في مؤسسة باترسون في 
تحليلات الأعمال» ومدير أبحاث مركز تعاون النظم الصحية» وأستاذ أعضاء مجلس الجامعة 
للعلوم الإدارية ونظم المعلومات في مدرسة سبيرز للأعمال بجامعة أوكلاهوما الحكومية 
(OSU)‏ وقد عمل قبل مسيرته الأكاديمية عالم أبحاث لمدة ه سنوات» في شركة خاصة 
للأبحاث والاستشارات« وھJ‏ ژر Knowledge Based Systems‏ في College Station‏ 
بولاية تكساس.ء وقد قاد خلال تلك الفترة عدداً من نظم دعم القرار ونظم المعلومات 
الأخرىء ومشاريع البحوث ذات الصّلة التي تمولها عدة وكالات فيدرالية: مثل وزارة 
الدفاع (002)» وإدارة الطيران والفضاء الوطنية )N48۸(‏ واي معهد الوطني للمعايير 
والتقنية »)N151(‏ ومنظمة دفاع القذائف البالستية (8120) ووزارة الطاقة (00۴). 
نشر الدكتور ديلن أكثر من ٠٠١‏ مقالة استعرضها الزملاء وقد ظهر بعضها في كبرى 
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ُبذة عن المؤلفين 


المجلات مثل علوم القرارء وأنظمة دعم اتخاذ القرارء واتصالات ۸۷٨4ء‏ وبحوث الحاسب 
والعمليات» وأجهزة الحاسب في الصناعةء ومجلة إدارة عمليات الإنتاج. والذكاء الاصطناعي 
في الطب وا مجلة الدولية للمعلوماتية الطبية. والأنظمة الخبيرة مع التطبيقات, والاتصالات 
اللاسلكية .1٤٤۴‏ وقام مؤخراً بتأليف / المشاركة في تأليف سبعة كتب نصية في مجالات 
واسعة النطاق من تحليلات الأعمالء والتنقيب في البيانات» والتنقيب في النص» وذكاء 
الأعمالء وأنظمة دعم القرار. وغالباً ما يُدعى للمشاركة في المؤتمرات الوطنية والدولية 
لعناوين رئيسة عن موضوعات ذات صلة بالتنقيب في البيانات/ النص وتحليلات الأعمال 
ونظم دعم القرار وذكاء الأعمال وإدارة المعرفة. شغل منصب مساعد الرئيس العام 
للمؤتمر الدولي الرابع للحوسبة الشبكية وإدارة المعلومات المتقدمة (6-1 سبتمبر ٠08‏ لام 
في سيولء كوريا الجنوبية) ويشارك بانتظام في رئاسة وتسيير أعمال مختلف مؤتمرات نظم 
المعلومات والمؤتمرات التحليلية. يشغل حاليا منصب رئيس التحريرء محرر أولء محرر 
مشاركء أو عضو في هيئة تحرير لأكثر من عشرة مجلات أكاديمية. ويعمل حاليًا رئيس 
تحريرء أو محرر أولء أو محرر مشاركء أو عضو مجلس تحرير لأكثر من اثنتي عشرة مجلة 
أكادهية. وتتمثل اهتماماته البحثية والتعليمية في التنقيب في البيانات والنص» وتحليلات 
الأعمالء ونظم دعم القرارء وإدارة امعرفةء وذكاء الأعمالء ونمذجة المؤسسات. 

- إفرايم توربان هاعد" duelo) :Efraim‏ على درجة ماجستير إدارة الأعمالء والدكتورام 
من جامعة كاليفورنياء بولاية بيركلي) وهو باحث زائر في معهد الباسيفيك لإدارة نظم 
المعلومات» بجامعة هاواي. وعمل قبل ذلك في العديد من الجامعات» مثل: جامعة سيتي 
في هونغ كونغ» وجامعة لي هاي» وجامعة فلوريدا الدوليةء وجامعة كاليفورنيا الحكومية 
ولونج بيتش» وجامعة إلينوي الشرقيةء وجامعة كاليفورنيا الجنوبية. وقد قام الدكتور 
توربان بتأليف أكثر من ٠٠١‏ ورقة محكمة تم نشرها في المجلات الرائدة. مثل: علوم 
الإدارةء ونظم المعلومات الإدارية الفصلية. ودعم اتخاذ القرار. كما ألّف ٠١‏ كتاباً مثل 
التجارة الإلكترونية: منظور إداري وتقنية المعلومات للإدارة. وهو أيضاً مستشارٌ لكبرى 
الشركات في جميع أنحاء العالم. وتتمثل مجالات اهتمام د. توربان الحالية في نظم دعم 
القرار على شبكة الإنترنت» والتجارة الاجتماعية» وصُنع القرار بشكل تعاوني. 
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نظرة عامة على ذكاء الأعمال والتحليلات وعلم البيانات 


أهداف التعلّم: 
- فهم الحاجة إلى الدعم المحوسب لصنع القرار الإداري. 
- التعرّف على تطوّر مثل هذا الدعم المحوسب للحالة الراهنة - علم التحليلات / البيانات. 
- وصف منهجية ومفاهيم ذكاء الأعمال. 
- فهم أنواع مختلفة من التحليلات» والاطلاع على تطبيقات مختارة. 
- فهم النظام البيئي للتحليلات لتحديد اللاعبين الأساسيين المتنوعين والفرص الوظيفية. 
ól‏ بيئة الأعمال (مناخ الأعمال) تنغير باستمرار حتى أصبحت أكثر تعقيدًا. وتخضع المنظمات, 
سواءً العامة أو الخاصة, لضغوط تجبرها على سرعة الاستجابة للظروف المتغيرة وأن تكون مبتكرةً في 
طريقة عملها. وتتطلب هذه الأنشطة من المنظمات أن تكون مرنةً وأن تتخذ قرارات إستراتيجية 
وتكتيكية وتشغيلية متكررة وسريعة: بعضها معقد جداً. اتخاذ مثل هذه القرارات يتطلب كميات 
كبيرة من البيانات والمعلومات وا معارف المرتبطة بالموضوع. والتي يجب أن تتم معالجتها في كثير 
من الأحيان وفق إِطارٍ معين وبشكلٍ عاجل وسريع وعادةً مايتطلب بعض الدعم المحوسب. 
ويتناول هذا الكتابُ استخدام تحليلات الأعمال كدعم محوسب لاتخاذ القرارات الإدارية, 
ويُركّز على أسس ونظريات دعم القرارء وكذلك على الأدوات والتقنيات التجارية pág dolt‏ 
هذا الكتاب أساسيات تلك التقنيات وطرق بناء الأنظمة واس تخدامها. ونتبع في ذلك نهج 1581 
لتقديم هذه المواضيع: Exploration (v. ,2«Jl) Experiences {yb el) Exposure‏ 
(الاستكشاف). ويقدّم هذا الكتاب بشكلٍ أساسي استكشاف تقنيات التحليل المختلفة وتطبيقاتها؛ 
لتصبح مصدر إلهام للطالب لتعلم كيفية استخدام المنظمات لتلك التحليلات في اتخاذ قرارات 
أو ميزات تنافسية. ونعتقد أن هذا التعرّض ما يحدث باستخدام التحليلات ونتائجها هو مكون 
رئيس لتعلّم تلك التحليلات. لوصف تلك التقنيات سنقدم أمثلةً لأدوات برمجية مُحدّدة بالإمكان 
استخدامها لتطوير هذه التطبيقات. وفي وصف الأساليبء نعرض كذلك أدوات البرمجيات 
المحددة التي يمكن استخدامها لتطوير مثل هذه التطبيقات. ولا يقتصر الكتاب على أداة برمجية 
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واحدة حتى يتمكّن الطالب من تجريب هذه التقنيات باستخدام أيّ أداة من الأدوات البرمجيات 
المتاحة. ونأمل أن مُكّن هذا التعرض والتجريب تحفيز القراء على استكشاف قدرات هذه 
التقنيات كل ف مجاله. ولتسهيل مثل هذا الاستكشاف؛ فإننا سنورد في هذا الكتاب التدريبات 
التي توجّه القارئ إلى شبكة جامعة تيراداتا وغيرها من المواقع» والتي تشمل تدريبات قائَةٌ على 
العمل الجماعي إذا لزم الأمر. 
يعرض هذا الفصل التمهيدى مقدمةً للتحليلات بالإضافة إلى نظرة عامة على هذا الكتاب» 

ويحتوي على الأجزاء التالية: 

1-١‏ مقال افتتاحي: التحليلات الرياضية - حدود مثيرة لتعلّم وفهم تطبيقات التحليلات. 

۲-١‏ بيئات الأعمال المتغيرة والاحتياجات المتطورة لدعم القرار والتحليلات. 

٣-١‏ تطؤر دعم القرار المحوسب لعلم البيانات/ التحليلات. 

٤-١‏ إطار عمل ذكاء الأعمال. 

0-١‏ نظرة عامة على التحليلات. 

7-١‏ أمثلة على التحليلات في مجالات مختارة. 

۷-١‏ مقدمة موجزة لتحليلات البيانات الضخمة. 

۸-١‏ نظرة عامة على النظام البيئي للتحليلات. 

9-١‏ خطة الكتاب. 

٠١-١‏ موارد» وروابط والاتصال بشبكة جامعة تيراداتا. 
1-١‏ مقال افتتاحي: التحليلات الرياضية - حدود مثيرة لتعلّم وفهم تطبيقات التحليلات: 

bs ol‏ التحليلات على مشكلات الأعمال من بين المهارات الأساسية التي ستتعلمها في هذا 

الكتاب» ويجري الآن تطبيقٌ العديد من هذه الأساليب لتحسين عملية صُنع القرار في جميع جوانب 
الرياضةء وهو مجالٌ مهم جدًا يُسمّى التحليلات الرياضية. isis‏ تحليلات الرياضة بمثابة فن وعلم 
جمع بيانات عن الرياضيين والفرق؟ لتكوين رؤى من شأنها تحسينُ القرارات الرياضية» مثل: تحديد 
اللاعبين الذين سيتمٌ الاستعانة بهم والأجور التي سيتمٌ دفعها لهم وكيف سيلعبون وكيف سيتمٌ 
تدريبهم. وكيفية الحفاظ على صحتهم» ومتى يمكن بيعهم ومتى يعتزلون. وبالنسبة للفرق؛ فإنَّ 
ذلك ينطوي على قرارات الأعمالء مثل تسعير التذاكرء فضلاً عن القرارات المتعلقة بقائمة اللاعبين 
وتحليل نقاط قوة وضعف كل منافس» والعديد من القرارات اليومية المتعلقة باللعبة. 
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في الواقع إِنَّ التحليلات في مجال الرياضة لها طابعٌ خاص؛ نظراً لأهمية هذا المجال في كونه مجال 
أعمال كبيراً يعحقق إيرادات تبلغ 140 مليار دولار أمريي تقريباً بشكلٍ سنوي؛ بالإضافة إلى ٠٠١‏ مليار 
دولار أخرى في الرهانات القانونية و١٠"‏ مليار دولار في الرهانات غير القانونية. في عام ١٠١۲م‏ وفقاً 
Waterhouse 4 dà:‏ معنرط تم إنفاق 180 مليون دولار فقط على التحليلات (أقل من 1٠,١‏ من 
الإيرادات)» ومن المتوقع أن ينمو الإنفاق بمعدل جيد ليصل إلى ٤.۷‏ ملیار دولار بحلول عام ۲۰۲۱م" . 

حظي استخدامٌ التحليلات في مجال الرياضة بشعبية من خلال aS gW Moneyball SLS‏ 
Lewis Michael‏ ف eY- -Y ele‏ وكذلك فيلم بطولة ele ġ Brad Pitt‏ ١١١٠م‏ والذي عرّض فيه 
Beane‏ 1yاBi‏ اممدير العام لأوكلاند أ استخدام البيانات والتحليلات؛ لتحويل فريق خاسر إلى فريق 
فائز. على وجه الخصوص؛ قام بيني بن بتعيين محلل استخدم التحليلات لصياغة لاعبين قادرين 
على الحصول على قاعدة بدلاً من اللاعبين الذين تميزوا في التدابير التقليدية مثل عمليات الضرب 
أو القواعد المسروقة. هذه الأفكار مكّنتهم من صياغة توقعات تغفل عنها الفرق الأخرى برواتب 
مبدئية معقولة؛ لقد نجحت تلك الأفكار ووصلوا إلى التصفيات في عامي 7٠١7‏ و١‏ ٠لام.‏ 

والآن يتم استخدامٌ التحليلات في جميع مناحي الرياضة. ويمكن تقسيمُ التحليلات ما بين 
المكتب الأمامي والمكتب الخلفيء ويُظهر مقال استبيان 011م103868 100" وصفاً جيداً لثلاثين 
Ita‏ وتشمل تحليلاث أعمال المكتب الأمامي تحليل سلوك الجماهير بدءً! من النماذج التنبؤية 
لتجديد تذاكر الموسم ومبيعات التذاكر العادية» إلى توقعات التهديف من قبل المشجعين فيما 
يتعنّق بالفريق والرياضيين والمدربين, واللاك. وهذا يشبه إلى حَدٌ كبير إدارة علاقات العملاء 
التقليدية (CRM)‏ وَيُعَدُ التحليلٌ المالي كذلك من المجالات الرئيسة؛ حيث iol a‏ الأقصى 
للراتب أو حدود البعثة جزءً! من المعادلة. 

ويشملٌ استخدام المكاتب الخلفية تحليلٌ كلّ من الرياضيين الأفرادء وكذلك لعب الفريق. وبالنسبة 
للاعبين الفرديين؛ يتمثل التركيز على نماذج التوظيف وتحليلات الكشافة وتحليلات القوة واللياقة البدنية 


(1) Source: Changing the Game: Outlook for the Global Sports Market to 2015, Price Waterhouse 
Coopers Report, appears at https://www.pwc.com/gx/en/hospitality-leisure/pdf/changing-the game- 
outlook-for-the-global-sports-marketto-2015.pdf. Betting data from https://www.capcredit.com/ 
how-much-americansspend-on-sports-each-year/. 

Q2) Sports Analytics Market Worth $4.7B by 2021," Wintergreen Research Press Release, covered by PR 
Newswire at http://www.prnewswire.com/news-releases/sports-analytics-market-worth-47-billion- 
by-2021-509869871.html, June 25, 2015. 
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iga PMs elI å alag Aal eL JS‏ الإفراط ف التدريب والإصابات» وكذلك فإن ارتجاج المخ 
من المجالات المهمة في الرياضة. وتشمل تحليلات الفريق الإستراتيجيات والتكتيكات, والتقييمات 
التنافسية. والخيارات الْمثلى للقائمة في إطار مختلف من الحالات الميدانية أو في الملاعب. وتوضّح 
As]‏ التوضيحية التالية كيف تستخدم ثلاث منظمات رياضية البيانات والتحليلات لتحسين العمليات 

الرياضيةء بنفس الطريقة التي قامت بها التحليلات بتحسين صناعة القرارات التقليدية في الصناعة. 


مثال١-‏ مكتب الأعمال: 


يعمل ديف وارد محلل أعمال لفريق كبير بلعبة البيسبول للمحترفين» ويركز عمله على العوائد 
وتحليل مبيعات التذاكر سواءً تذاكر موسم كامل أو تذكرة واحدة. بعض الأسئلة التي تخضع 
لمسؤوليته تتضمّن اذا يُجدّد (أو لا يُجدَّد) حاملو التذاكر الموسمية تذاكرهم» وكذلك العوامل التي 
تدفع الجمهور لشراء تذكرة مقعد فردي في آخر لحظة» وأيضاً كيفية تسعير التذاكر. وتشمل بعض 
الأساليب التحليلية التي يستخدمها مكتب Olelas} Dave‏ بسيطة عن سلوك الجماهير. مثل الحضور 
العام والإجابات عن أسئلة الاستبيان حول احتمال الشراء مرةً أخرى. ومع ذلك؛ فقد يختلف ما يقوله 
الجماهير عمًا يفعلونه. ويقوم 04۷76 بإجراء استبيان المشجعين من خلال المكان المحجوز ممقعد 
التذكرة «الدرجة» ويسأل عن احتمال تجديد تذاكر الموسم. ولكنه عندما يقارن ما يقولونه مقابل ما 
يفعلونه؛ يكتشف اختلافات كبيرة (انظر الشكل .)١-١‏ حيث تبيّن له أن 79 من المشجعين في مقاعد 
الدرجة الأولى الذين قالوا في الاستبيان أنهم «قد لا يُجِدّدون» قد جدَّدوا بالفعل» وكوّن هذا بالنسبة 
á$) d‏ جيدةً مفادها أنَّ العملاء في الخلايا الخضراء سيقومون على الأرجح بتجديد تذاكرهم؛ لذلك 
يحتاجون إلى جهد أقل في التسويق وصرف الدولارات مقارنةٌ بالعملاء في الخلايا الزرقاء. 





مؤكد لا مجتمل لا ريما محتمل محتمل جدا الطبقة 
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شكل :1-١‏ تجديد تذاكر الموسم - نتائج الدراسة الاستقصائية 


(3) Sources: Thomas Davenport, "Analytics in Sports: The New Science of Winning, International 
Institute for Analytics White paper, sponsored by SAS, February 2014. On the SAS Web site at: 
http://www.sas.com/content/dam/SAS/en us/doc/whitepaper2/iia-analytics-in-sports-106993.pdf. 
(Accessed July 2016). 


Yr‏ ذكاء الأعمال والتحليلات وعلم البيانات. منظور إداري 


نظرة عامة على ذكاء الأعمال والتحليلات وعلم البيانات 


ولكن هناك عدة عوامل تؤثرٌ على سلوك الجمهور فيما يتعلق بشراء التذاكر وخاصةً السعر؛ 
مما يستدعي إجراء إحصاءات أكثر تطؤراً وتحليل بيانات. في كلا المجالين وخصوصاً تذاكر اللعبة 
الواحدة؛ يقود ديف استخدام التسعير الديناميي؛ لينقل المجال من التسعير الثابت البسيط 
المعتمد على موقع المقعد إلى التسعير الديناميكي اليومي المتأثر بالصعود والهبوط. يُعتبّر هذا 
ا لمجال مجالًا بحثيًا ثريا للعديد من الفرق الرياضية من شأنه زيادة فرص تحسين إيراداتهم. على 
سبيل اطثال: عند التسعير يجبٌ مراعاة سجل الفريق ومن يلعبون وتواريخ وتوقيت المباريات 
التي يلعب فيها اللاعبون النجوم لكلّ فريق» وتاريخ تجديد تذاكر الموسم أو شراء تذاكر فردية. 
بالإضافة إلى عوامل أخرى مثل مكان المقعد, وعدد المقاعد. والمعلومات التي تواكب وقت المباراة, 
مثل الازدحام المروري وقت المباراة وحتى الطقس. انظر الشكل ١-ا.‏ 


ر أناء الفزيق شخب لاز فى لجر :10 مزهريات 








شكل :۲-١‏ التسعير الحركي للعمل السابق - دوري البيسبول الأساسي 

أي من هذه العوامل أكثر أهميةً؟ وما مقدار أهميته؟ اعتماداً على الخبرة الإحصائية الواسعة؛ 
قام ديف ببناء نماذج انحدار لاستخلاص العوامل الرئيسية التي تقودٌُ تلك السلوكيات التاريخية 
وقام بإنشاء 735 لتحديد كيفية إنفاق موارد التسويق لدفع الإيرادات. كما قام بإنشاء نماذج 
مُخصّصة لحملة التذاكر الموسمية لتحديد شرائح العملاء الذين سيقومون أو لن يقوموا بالتجديده 
أو مَنْ لا يستطيعون اتخاذ قرار مناسب ومن خلال ذلك هكن القيامٌ بحملات تسويقية أكثر 
دقة. وبالإضافة إلى ذلك؛ يقوم بإجراء إحصاء للتوقعات المتعلقة بالتهديف من خلال تعليقات 
الجمهور, مثل التغريدات التي تساعده على تقسيم المشجعين إلى شرائح ولائية مختلفة. وتساعد 
الدراسات الأخرى عن دوافع حضور لعبة فردية إدارة التسويق على فهم تأثير الهدايا مثل القمصان 
isok‏ أو اقتراحات حول أماكن نشر الإعلانات التلفزيونية الفورية. 
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وبالإضافة إلى الإيرادات؛ يوجد العديدٌ من ا مجالات التحليلية الأخرى التي يعمل عليها فريق 
e‏ مما في ذلك التسويقء وعوائد إعلانات الراديو والتليفزيون وتقديم البيانات إلى المدير 
العام بشأن المفاوضات على الراتب» ومشاريع التحليلات الخاصة بالنظر إلى الحَدَّ الأقصى للراتب» 
وفعالية الترويج بما في ذلك القنوات الإعلانية» والتوعية بالعلامة التجارية, وكذلك تحليلات الشركاء. 


































نسبة الجري:46,4896 
نسبة التمرير: 53.5296 
إذا كانت نسبة الخطا 
.22 ,11.20 ,10 
322 ,30,31 ,12.21 

إجمالي اللعبات:385 إجمالي اللعبات:155 
i‏ 99 312964 نسبة الجري:79.3596 
نسبة التعرير: 66.15% نسية التمرير: 20.6596 





الأول أو الثقى ثحت 
إجملى اللعبات:294 
نسبة الجري:38.7896 
نسبة التمرير: 61.222% 
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إجمالى اللعبات:66 [E M‏ إجمالى اللمبات:162 
نسبة الجري:4.55% نسبة الجري:24.24% نسبة الجري:50.62% 
نسبة للتمرير: 95.45% ئىجة التەرير: 15.67% نسبة التمرير: 49.38% 





شكل :8-١‏ شجرة القرارات المتتالية لتنفيذ أو تمرير اللعبات 


:The Coach المدرب‎ -Y Jio 
بوب بريدلوف مدربٌ كرة قدم لفريق إحدى الكليات الكبيرة» ويُركّر بشكلٍ كاملٍ على الفوز‎ 
بالمباريات. يركز بوب على استقطاب أفضل اللاعبين في المدارس الثانوية» وتطوير مهاراتهم‎ 
لتتناسب مع أنظمة هجومه ودفاعه. وكذلك الحصولٌ على أقصى جهدٍ ممكن منهم في أثناء‎ 
المباريات. يقع تحت مسؤولياته أيضاً الإجابة عن أسئلة مثل: مَنْ سنستقطبٌُ من اللاعبين؟ ما‎ 
التدريبات التي تساعدٌ على تطوير مهاراتهم؟ ما مدى صعوبة دفع وتحفيز لاعبينا؟ وما نقاط‎ 

قوة وضعف المنافسين؟ وكيف ممكننا معرفة أو التعرّف على اتجاه لعبهم؟ 

ولخحُمَّن الحظ؛ استعان فريقه بخبيرة عمليات الفريق الجديدة دار برناككء المتخصّصة في 
مساعدة المدربين في اتخاذ القرارات التكتيكيةء وتعمل دار مع فريق من الطلاب المتدربين الذين 
يقومون بإجراء تحليلات للخصم باستخدام فيلم المباراةه والذي يقوم المدربٌ بالتعليق عليه لإنشاء 
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نموذج شجرة القرارات المتتالية كما في الشكل "-١‏ للتنبؤ بما إذا كانت المباراة التالية ستكون مباراة 
جري أو تمرير. أمّا بالنسبة للمنسق الدفاعي؛ فقد قاموا ببناء خرائط حرارية كما في الشكل 6-١‏ 
لكل هجوم للخصم لتوضيح مَيْلِهِم إلى التمرير إلى اليسار أو اليمين وإلى مناطق التغطية الدفاعية. 
وأخيرا قاموا بإجراء تحليلات لبعض السلاسل الزمانية كما في الشكل 0-١‏ على المباريات القوية 
(تُعرف على أنها الحصول على ١1‏ تمريرة صحيحة أو الجري لمسافة ١7‏ ياردة أو أكثر). لكل مباراة 
يقارنون نتائج التحليل بتشكيلاتهم الدفاعية وهجوم الفرق المنافسة لمساعدة المدرب بريدلوف 
على التفاعل بسرعة أكبر مع التحؤلات في أثناء المباراة. سيتم شرح هذه الأساليب التحليلية بشكلٍ 
مفصل في الفصول الثاني والخامس والسابع. 
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شكل :٤-١‏ تحليل منطقة الخريطة الحرارية للتمريرات 
وتش مَل الأعمال الجديدة التي تقوم بها ة2 بناء نماذج أفضل لاس تقطاب الرياضيين من 
المدارس الثانوية. فعلى سبيل المثال؛ يقدّم فريق العمل في ele ÍS‏ منحاً دراسيةٌ لثلاثة طلاب 
يتم اختيارهم للفريق. أما بالنسبة ل 04١‏ فإن اختي ار أفضل اللاعبين لا يقتصر على المقاييس 
البسيطة مثل مدى سرعة اللاعبين» ومدى ارتفاع قفزاتهم» وطول أذرعهم؛ بل يتخطاها إلى معايير 
جديدة. مثل مدى سرعة تدوير رؤوسهم لالتقاط التمريرات» وما أنواع وأوقات رد الفعل للاعب 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري Yo‏ 


الفصل الأول 


على المؤثرات المتعددة. ومدى دقة تنفيذه للتمريرات. وتُنشر بعض أفكار دار في توضيح هذه 
المفاهيم على موقع e TUN‏ شبكة الإنترنت؛ ابحث BSI Case of Precision Football je‏ . 











شكل :0-١‏ تحليل السلاسل الزمنية للعبات الساخنة 
مثال*- المدرب #عصنهءآ' عط1: 

يعمل الدكتور دان جونس ون مدرباً لفريق كرة القدم بكلية المرأة لمساعدة اللاعبات على 
الحفاظ على صحتهن وتقديم المشورة للمدربين بخصوص قدرة التحمّل لكل لاعبة خلال 
التدريبات. كذلك يهتمٌ جونس ون برفاهية اللاعبات بما في ذلك مقدار النوم ووقت الراحة لكل 
لاعبة بين فترات التدريب الثقيلة والخفيفةء والهدف من ذلك التأكّد من استعداد اللاعبات للعب 
بأقصى قدر ممكن من الكفاءة في أثناء المباريات. 

ead i dd‏ وبسبب اس تخدام الأجهزة الرياضية المتطوّرة؛ كان هناك المزيدٌ من البيانات 
التي مكّنت الدكتور 2ة(1 من التحليل. فقد كانت اللاعبات يستخدمن OUS‏ تحتوي على أجهزة 
الاستشعار يمكن من خلالها قياسٌ الأحمال الداخلية؛ مثل ضربات القلب» ودرجة حرارة الجسم 
ومُعدلات التنفس علاوةً على سُتّرات التسارع التي تقيسٌ الأحمال الخارجيةء مثل العدو لمسافات 
والسرعات وكذلك التسارع والتباطؤ. ومن ثم التعرّف على اللاعبات اللاتي يُعطين أقصى جهد 
خلال التدريبات ومن لَسْنَ كذلك. 
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وينصبٌ تركير جونس ون حاليًا على الأبحاث التي تساعده في التنبؤ بإصابات اللاعبات وكيفية 
الوقاية منها (الشكل .)1-١‏ ويمكن أن توفْر تدريبات بسيطة مثل الوقوف على ساق واحدة 
وجلوس القرفصاء واختبار إمساك ساق ثم السّاق الأخرى مع وجود فرق نقاط أكثر من “3٠١‏ رؤى 
مفيدة لجونسون حول نقاط قوة وضعف الجسم كما في شكل .۷-١‏ فإذا أصيبَت لاعبة خلال 
المباراة» يمكن للمدرب إجراءٌ اختبار جانبي لرد فعل تحفيزي على جهاز محمولء والتي تضيفٌ إلى 
بروتوكولات الصدمات التقليدية. وتظهر أجهزة استشعار النوم مَنْ الذي يحتاج إلى الحصول على 
راحة كافية (أو الذين سهروا طوال الليل). كما استعان د. دان بمختبر التصوير بالرنين المغناطيسي 
في الحرم الجامعي للقيام بمسح الدماغ الدوري لإظهار أي الرياضيين عُرضةً للإصابة بإصابات الدماغ. 




















شكل :۷-١‏ اختبار قرفصاء الساق الواحدة 
شكل :٦-١‏ نماذج إصابات كرة القدم° - اختبار قوة الجسم الأساسية 


(5) "إصابات كرة القدم للسيدات»" المركز القومي لتقارير بحوث الإصابات الرياضية الكارثية NCAA‏ يتم إنتاج أوراق واقع 
الإصابات الرياضية ٥۸4‏ بواسطة مركز لةه لأبحاث الإصابات الرياضية والوقاية منها بالتعاون مع الرابطة القومية 
لرياضة الجامعات وإصابات رياضة 5108 تصدر في: 

https://www.ncaa.org/sites/default/files/NCAA W Soccer Injuries WEB.pdf 
)7017 (تم الوصول إليها في نوفمير‎ 
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الفصل الأول 


أسئلة على هذه الأمثلة: 

-١‏ ما العوامل الثلاثة التي قد تكون جزءً! من 24 لتجديد تذكرة الموسم؟ 

-Y‏ ما الأساليب التي يمكن أن تستخدمها فرق كرة القدم للقيام بتحليل الخصم؟ 

*- كيف يكن للأجهزة القابلة للارتداء تحسين صحة وسلامة اللاعب؟ وما أنواع التحليلات 
الجديدة التي يمكن أن يستخدمها المدربون؟ 

ع- ما استخدامات التحليلات الأخرى التي يمكنك تصورها في الألعاب الرياضية؟ 


ماذا يمكننا أن نتعلّم من هذه المقالة القصيرة: 

بعيدًا عن مُحلَلي الأعمال في المكاتب الأمامية والمدربين وخبراء الأداء؛ فإن هناك العديد من 
الأشخاص الآخرين في الألعاب الرياضية يستخدمون البيانات» بدءًا من لاعبي الجولف الذين 
يقيسون ظروف التربة والأرض لبطولات 264 وحكام البيسبول وكرة السلة الذين يتم تقييمهم 
sta‏ على قراراتهم الصحيحة وغير الصحيحة التي يجرونها. وفي الواقع؛ يصعب العثور على مجال 
من مجالات الرياضة لا يتأثر بتوفر المزيد من البيانات. وخاصةً من أجهزة الاستشعار. 

إن المهارات التي ستتعلمها في هذا الكتاب لتحليل الأعمال تنطبق على الرياضة. فإذا كنت 
ترغب في التعمق في هذا المجال؛ فإننا نشجعك على الاطلاع على قسم تحليلات الرياضة بشبكة 
جامعة تيراداتا (11023): وهي مصدرٌ مجاني للطلاب وأعضاء هيئة التدريس. وفي هذا الموقع؛ 
سوف تجد وصفاً لا يجب قراءته لمعرفة المزيد عن التحليلات الرياضيةء ومجموعات من الأماكن 
التي يمكنك العثور بها على مجموعات البيانات المتاحة للجمهور للتحليل؛ فضلًا عن أمثلة لمشاريع 
الطلاب في تحليلات الرياضة ومقابلات المهنيين الرياضيين الذين يستخدمون البيانات والتحليلات 
للقيام بوظائفهم. 
7-١‏ بيئات الأعمال المتغيرة والاحتياجات المتطوّرة لدعم القرار والتحليلات: 

توضّح المقالة الافتناحية كيف يمكن للصناعة بأكملها أن تستخدم تحليلات لوضع تقارير عمًا 
يحدث. والتنبؤ بما يمكن أن يحدثء ومن ثم اتخاذ القرارات أيضاً لتحقيق أفضل استفادة من 
Sources: Business Scenario Investigation BSI: The Case of Precision Football (video). (Fall 2015).‏ )4( 


Appears on http://www.teradatauniversitynetwork.com/About-Us/Whats-New/BSI-Sports-Analytics- 
Precision-Football//, Fall 2015. (Accessed September 2016). 
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الوضع القائم. وتتطلّب هذه الخطوات من المنظمة جمع وتحليل المخزون الضخم من البيانات. 
ومن الاستخدامات التقليدية في وظائف كشوف المرتبات وإمساك الدفاتر. توغلت النظم المحوسبة 
الآن في مجالات إدارية معقدة تتراوح بين تصميم وإدارة المصانع الآلية إلى تطبيق أساليب تحليلية 
لتقييم عمليات الاندماج والاستحواذ المقترحة. ويعرف جميع المديرين التنفيذيين تقريبًا أن تقنية 
المعلومات ذات أهمية حيوية لأعمالهم ويستخدمون تقنيات المعلومات على نطاق واسع. 
وقد انتقلت تطبيقات الحاسوب من أنشطة معالجة المعاملات ورصدها إلى تحليل المشكلات 
وتطبيقات الحلولء وتم القيامُ بالكثير من الأنشطة باستخدام التقنيات المستندة إلى السحابة» التي 
تم الوصول إليها في كثير من الحالات من خلال الأجهزة المتنقلة. إن أدوات التحليل وذكاء الأعمال 
مثل مستودع البيانات, والتنقيب في البيانات, والمعالجة التحليلية الفورية (01.47) ولوحات 
المعلومات, واستخدام الأنظمة القائمة على السحابة لدعم القرار؛ هي أهمٌ عناصر الإدارة الحديثة 
في الوقت الحاضر. وأصبح من المحتمل أن يكون لدى المديرين أنظمة معلومات وشبكات (سلكية 
أو لاسلكية) عالية السرعة لمساعدتهم في مهمتهم الأكثر أهميةٌ وهي اتخاذ القرارات. وفي كثيرٍ من 
الحالات» يتح تنفيذ مثل هذه القرارات آلياً بشكل روتيني؛ مما يلغي الحاجة إلى أي تدخل إداري. 
وبالإضافة إلى الزيادة الواضحة في قدرات المكوّنات المادية والبرمجيات والشبكات؛ ساهمت 
بعض التطورات بشكلٍ واضح في تسهيل زيادة دعم القرارات والتحاليل بعدة طرقء منها: 
- التواصل والتعاون الجماعي: يتم اتخاذ العديد من القرارات اليوم من قبل المجموعات التي قد 
يكون أعضاؤها في مواقع مختلفة. وتستطيع ا مجموعات التعاون والتواصل بسهولة باستخدام 
أدوات التعاون وكذلك الهواتف الذكية في كلّ مكان. ويكتسب التعاون أهميةٌ خاصة على 
امتداد سلاسل التوريد؛ إذ يجبٌ على الشركاء تبادل المعلومات مع المورّدين والعمال بصفة 
مستمرة. وقد يكون تجميع مجموعة من صانعي القرارء وخاصةً الخبراءء في مكانٍ واحد 
باهظ التكلفة. وبالتالي يمكن لنظم المعلومات أن تحسّن عملية التعاون في مجموعة ما وتمكن 
أعضاءها من التواجد في مواقع مختلفة (لتوفير تكاليف السفر). والأهم من ذلك؛ أن هذا 
التعاون في سلاسل التوريد يسمح للمصنّعين بمعرفة أنماط التغير في الطلب في الوقت المناسب» 
وبالتالي يتفاعلون مع تغيُّرات السوق بشكل أسرع. 
)0( «إصابات كرة القدم للسيدات» المركز القومي لتقارير بحوث الإصابات الرياضية NCAA AS‏ يتم إنتاج أوراق واقع الإصابات 
الرياضية 71044 بواسطة مركز وزله:ه2 لأبحاث الإصابات الرياضية والوقاية منها بالتعاون مع الرابطة القومية لرياضة الجامعات 
وإصابات رياضة 5108. تصدر في: https//www.ncaa.org/sites/default/files/NCAA "W Soccer Injuries WEB.pdf.‏ 
(تم الوصول إليها في نوفمير 015). 
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- تحسين إدارة البيانات: تنطوي العديدٌ من القرارات على حسابات مُعقدة تعتمد على بيانات 
مخزنة في مستودعات مختلفة في أماكن داخل وربما خارج المنظمة. وقد تتضمّن البيانات النص 
والصوت والرسومات والفيديوء وقد تكون هذه الصيغ بلغات مختلفة. وفي كثير من الأحيان 
يكون من الضروري نقل البيانات بسرعة من مواقع بعيدة. ومن خلال أنظمة اليوم يمكن 
البحث عن البيانات اللازمة وتخزينها ونقلها بسرعة وبتكلفة اقتصادية وأمان وشفافية. 

- إدارة مستودعات البيانات العملاقة والبيانات الضخمة: تحتوي مستودعات البيانات الضخمة 
مثل تلك Walmart loys gll‏ على كميات هائلة من البيانات. وتتوفر أساليب خاصة بما في 
ذلك الحوسبة المتوازية Hadoop/Sparks‏ ومثيلاتها لتنظيم البيانات والبحث فيها والتخلص 
منها. وتتناقص تكاليف تخزين والتنقيب في البيانات بسرعة. هذه التقنيات تندرجٌ تحت فئة 
واسعة من البيانات الضخمة التي تم جمعها من مصادر متنوعة وبأشكال مختلفةء جمع تلك 
البيانات يعطي رؤية كاملة للأداء التنظيمي هذه الرؤية لم تكن ممكنةً في الماضي. 

- الدعم التحلياي: ومع المزيد من تقنيات البيانات والتحليلء يمكن تقييمٌ المزيد من البدائل» 
ويمكن تحسين التنبؤات» ويمكن إجراء تحليل المخاطر بسرعة» كما يمكن جمع آراء الخبراء 
(وبعضهم في مواقع نائية) بسرعة وبتكلفة منخفضة. ويمكن استخلاص الخبرة حتى بشكلٍ 
مباشر من النظم التحليلية. وباستخدام هذه الأدوات» يستطيعٌ صانعو القرار إجراء محاكاة 
معقدة والتحقق من العديد من السيناريوهات المحتملةء وتقييم الآثار المتنوعة بسرعة 
واقتصادية. وهذا بالطبع هو محور عدة فصول في هذا الكتاب. 

- التغلب على الحدود المعرفية في معالجة وتخزين المعلومات: وفقاً ل (1977) ÓL 3! Simon‏ 
للعقل البشري قدرةٌ محدودةً على معالجة وتخزين المعلومات. ويجد الناسٌ أحياناً صعوبة في 
استرجاع واستخدام المعلومات دون أخطاء بسبب حدودهم المعرفية. ويشير مصطلحٌ الحدود 
المعرفية إلى أن قدرة الفرد على حل المشكلات تكون محدودةً عندما تكون هناك حاجة إلى 
مجموعة واسعة من المعلومات والمعرفة المتنوعة. فالنظم المحوس بة تمكن الناس من التغلّب 
على حدودهم الإدراكية من خلال الوصول السريع ومعالجة كميات هائلة من المعلومات المخزنة. 

- إدارة المعرفة: وقد جمعت المنظماتُ مستودعاتٍ هائلةً من المعلومات عن عملياتها الخاصة, والعملاء 
والإجراءات الداخلية. وتفاعلات الموظفينء وما شابه ذلك. من خلال الاتصالات المهيكلة وغير المهيكلة 
التي تجري بين مختلف أصحاب المصالح. وأصبحت نظم إدارة المعرفة بالنسبة للمديرين مصادر 
للدعم الرسمي وغير الرسمي لاتخاذ القرارات» وإن كانت لا تسمى أحياناً بنظم إدارة المعرفة. التقنيات 
مثل تحليل النصوص و1878502 18134 جعلت من الممكن استخراج قيمة من هذه المستودعات. 
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هذا أكبر تغيير حدث في السنوات القليلة الماضية. فالسرعة التي تحتاج إلى معالجة ا معلومات 
وتحويلها إلى قرارات قد غيرت بالفعل توقعات المستهلكين والشركات celsa ie e‏ وقد أذّى 
كل ذلك إلى استخدام الدعم المحوسب للقرارات منذ أواخر الستينيات» وبصفة خاصة منذ 
منتصف التسعينيات. وقد أتاح نمو التقنيات المتنقلة ومنصات وسائل التواصل الاجتماعي 
والأدوات التحليلية مستوّى مختلفاً من دعم نظم المعلومات (15) للمديرين. ولا يمتد هذا النمو 
في توفير الدعم المعتمد على البيانات لأي قرارٍ إلى المديرين فحسب ولكن أيضاً إلى المستهلكين. 
وسنقوم أولاً بدراسة لمحة عامة عن التقنيات التي تمت الإشارة إليها على نطاق واسع باسم ذكاء 
الأعمال. من هذا المنطلق سوف نقوم بتوسيع آفاقنا لتقديم أنواع مختلفة من التحليلات. 


أسئلة مراجعة على القسم :٠-١‏ 

-١‏ اذكر بعض الاتجاهات الرئيسة الموجهة بالنظام والتي عرْرت عملية صُنع القرار التي تدعمها 
نظم المعلومات JI "IS"‏ مستوى جديد؟ 

؟- اذكر بعض قدرات نظم المعلومات التي يمكن أن تسهّل اتخاذ القرارات الإدارية. 

AS -Y‏ هكن للحاسوب المساعدة في التغلّب على الحدود الإدراكية للإنسان؟ 


Y-Y‏ تطوّر دعم القرار المحوسب لعلم البيانات/ التحليلات: 

يُبيّنَ الجدول الزّمني الوارد في الشكل (6-1) المصطلحات المستخدمة لوصف التحليلات منذ 
السبعينيات. وخلال السبعينيات؛ كان التركير الأساسي لنظم ا معلومات في دعم القرارات على 
تقديم تقارير دورية منظمة يمكن للمدير استخدامُها في اتخاذ القرارات (أو تجاهلها). وقد بدأت 
الأعمال في إنشاء تقارير روتينية لإبلاغ صانعي القرار (المديرين) بما حدث خلال فترة سابقة (يوم» 


المصدر والاعتمادات: لقد قام الدكتور +»3دمدء5 2+6 بتلك المساهمة, والذي تقاعد بعد ١6‏ عاماً من التطوير 
والتسويق المتقدمين في تيراداتاء وقد ظل في مجلس المستشارين بشبكة جامعة تيراداتا؛ ليقضي فترة تقاعده في مساعدة 
الطلاب وأعضاء هيئة التدريس على معرفة المزيد عن التحليلات الرياضية. تم تصميم صور كرة القدم (الأشكال ٠-١‏ 
و١-0)‏ بواسطة طلاب الدراسات العليا م11 ۴۴# ووعد اهعه[ بجامعة أوكلاهوما الحكومية. كجزء من مشروع 
طلابي في ربيع عام 11١م.‏ وتم اقتباسٌ صور التدريب (الأشكال 7-١‏ و١-۷)‏ من الصور التي قدّمها كلّ من البروفيسور 
Gary Wilkerson‏ من جامعة تينيسي قي تشاتانوجا والبروفيسور هامن© «اونطدة من جامعة أوبورن. 
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à sb po gl‏ شهرء أو ربع سنة). وعلى الرغم من أنه كان من المفيد معرفة ما حدث في الماضي: 
LS‏ المديرين كانوا بحاجة إلى أكثر من ذلك؛ لأنهم يحتاجون إلى مجموعة متنوعة من التقارير 
على مستويات مختلفة من التفصيل لفهم ومعالجة الاحتياجات والتحَدَّيات المتغيرة للشركة 
بشكل أفضل. Gi u$ ls ales‏ هذه بِنُظُم المعلومات الإدارية (815). في أوائل السبعينيات» 
وقد طرح 56011-21011012 المفاهيم الرئيسة لنظام دعم القرار 255. وقد غرفت نظم دعم 
القرار 12555 بأنها «أنظمة حاسوبية تفاعلية, تساعد صُناع القرار على استخدام البيانات والنماذج 
ded‏ المشكلات غير المهيكلة» 0127© و(1971) 310]08-:500. وفيما يلي تعريف كلاسيكي 
:Scott-Morton (1978) 5 Keen 4933 (JJls .DSS J ,1‏ 


تجمع نظم دعم القرار بين الموارد الفكرية للأفراد مع قدرات الحاسب ب؟ لتحسين 
نوعية القرارات. وهو نظام دعم قائم على الحاسوب لصناع القرار الإداريين الذين 
يتعاملون مع المشكلات شبه الهيكلية. 











شكل :۸-١‏ تطور دعم القرار وذكاء الأعمال والتحليلات 

لاحظ أنَّ مصطلح «نظام دعم القرار»» مثل نظام ال معلومات الإدارية والعديد من المصطلحات 
الأخرى في مجال تقنية المعلومات. هو تعبيرٌ خالٍ من المحتوى ise)‏ أنه يعني أشياء مختلفة 
لأشخاص مختلفين). ولذلك؛ لا يُوجَد تعريف مقبول عاميًا لنظام دعم القرار. 

وخلال الأيام الأولى من التحليلات؛ غالبًا ما يتم الحصول على البيانات من خبراء المجال 
باستخدام العمليات اليدوية (أيْ: المقابلات والاستقصاءات) لبناء النماذج الرياضية أو المعرفة 
القائمة على d‏ مشكلات التحسين المقيّدة. وكانت الفكرة هي تحقيق الأفضل بالموارد المحدودة. 
ls Gales‏ تُسمّى ges e‏ القرار هذه باسم بحوث العمليات (08). ولقد تمت معالجة 
المشكلات التي كانت معقدةً إلى درجة لم يكن يمكن حلها على النحو الأمثل (باستخدام أساليب 
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البرمجة الرياضية الخطية أو غير الخطية) باستخدام أساليب الاستدلال مثل نماذج المحاكاة. 
(سنقدّم هذه التحاليل الوصفية لاحقاً في هذا الفصل وبتفاصيل أكثر في الفصل السادس). 

وفي أواخر السبعينيات وأوائل الثمانينيات؛ وبالإضافة إلى نماذج بحوث العمليات الناضجة 
التي كانت تُستَخدّم في العديد من الصناعات والنظم الحكومية؛ ظهرت مجموعةٌ جديدةٌ ومثيرة 
من النماذج مثل: نظم الخبراء القائمة على القواعد. وقد بشّرت هذه الأنظمة بحصر Gyles‏ 
الخبراء في شكل تستطيع الحواسيب معالجته (من خلال مجموعة من القواعد أو الاستدلالات)؛ 
بحيث يمكنُ استخدام هذه القواعد للتشاور بنفس الطريقة التي يستخدمها خبراءٌ المجال لتحديد 
مشكلة مهيكلة ووصف الحلّ الأكثر احتمالًا. وقد سمحت النظم الخبيرة 8:55 بتوفير الخبرة 
النادرة عندما يلزم الأمر؛ وذلك باستخدام نظام دعم القرار 255 «الذي». 

ولقد شهدت الثمانينيات تغيرًا كبيرًا في طريقة استحواذ المنظمات على البيانات المتعلقة 
بالأعمال التجارية. وكانت الممارسة القدهمة تتمثل في وجود عدة نظم معلومات مُفكّكة مُصمّمة 
خصيضًا لتجميع بيانات المعاملات لمختلف الوحدات أو الوظائف التنظيمية (مثل: المحاسبة, 
والتسويقء والمبيعات. والتمويلء والتصنيع). وفي الثمانينيات؛ تمّ دمج هذه الأنظمة كنظم 
معلومات على مستوى المؤسسة التي نسميها الآن نظم تخطيط موارد المؤسسة (8187). وتم 
استبدالٌ مخططات تمثيل البيانات القدهة المتسلسلة وغير المعيارية بأنظمة إدارة قواعد البيانات 
(RDBM) LAM‏ وقد أتاحت هذه النظم تحسين الحصول على البيانات وتخزينهاء فضلًا عن 
العلاقات بين حقول البيانات التنظيمية مع انخفاض ملحوظ في تكرار المعلومات. 

وبرزت الحاجةٌ إلى نظم إدارة قواعد البيانات العلائقية (/11081) ونظم تخطيط موارد المؤسسة 
(1810) عندما أصبحت سلامة البيانات واتساقها مشكلةٌ؛ مما أعاق بشكل كبير فعالية الممارسات 
التجارية. وبتخطيط موارد المؤسسات؛ يتخ جمحٌ ÍS‏ البيانات من جميع أركان اللمؤسسة ودمجها 
في مخطط ثابت؛ بحيث يكون dS‏ جزءٍ من المنظمة حقٌ الوصول إلى نسخة واحدة من الحقيقة 
متى لزم الأمر. وبالإضافة إلى ظهور أنظمة تخطيط موارد امؤسسات» أو رها بسبب هذه الأنظمة؛ 
أصبح إعداد تقارير الأعمال ممارسة تجارية حسب الطلب» أو حسب الحاجة. وهكن لصناع القرار 
أن يُقَرّروا متى يحتاجون أو يريدون إنشاء تقارير متخصصة لتقم المشكلات والفرص التنظيمية. 

وفي التسعينيات» أذّت الحاجة إلى إعداد تقارير أكتر تنوعًا إلى تطوير أنظمة المعلومات 
التنفيذية (تمّ تطويرٌ نظم ال معلومات التنفيذية 8155 ونظام دعم القرار خصيصًا للمديرين 
التنفيذيين واحتياجاتهم من اتخاذ القرار) وقد صُّمّمت هذه الأنظمة على شكل لوحات بيانية 
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وبطاقات قياس؛ بحيث يكن أن تكون بمثابة عروض جذَّابة بصريًا مع التركيز على al‏ العناصر 
التي يمكن لصانعي القرار من خلالها تتبّع مؤشرات الأداء الرئيسة. ولجعل هذا التقرير أكثر 
تنوعًا مع الحفاظ على سلامة المعاملات لنظم المعلومات التجارية؛ كان من الضروري إنشاء طبقة 
البيانات المتوسطة المعروفة باسم مستودعات البيانات )0W(‏ كمستودع لدعم تقارير الأعمال 
وصُنع القرار تحديدًا. وخلال وقتِ قصير جدًا؛ اعتمدت معظم الشركات الكبيرة والمتوسطة 
الحجم مستودعٌ البيانات كمنصة لصُنع القرار على مستوى المؤسسة. وحصلت لوحاتٌ المعلومات 
وبطاقات الأداء على بياناتها من مستودعات البيانات (21587)؛ وبذلك تحسَّنَت كفاءة أنظمة 
المعاملات التجارية التي يشار إليها في معظمها بأنظمة تخطيط موارد المؤسسة (ERP)‏ 

وف العقد الأول من القرن العشرين؛ بدأ يُطلّق على الأنظمة القائمة على مستودعات البيانات 
اسم «أنظمة ذكاء الأعمال». ومع ازدياد كمية البيانات الطولية المتراكمة في مستودعات البيانات؛ 
كان لا بذ أن تواكب قدرات الأجهزة والبرمجيات الاحتياجات المتطورة والسريعة التغيّر لصانعي 
القرار. وبسبب السوق التنافسية المعويلة؛ يحتاج صانعو القرار إلى استيعاب المعلومات الحالية 
في قالب سهل الفهم لمعالجة مشكلات الأعمال والاستفادة من فرص السوق في الوقت المناسب. 
ex ae ds‏ تحديث البيانات في مستودعات البيانات بشكلٍ دوري؛ فإنها لا تعكس أحدث 
العلومات. : وللتغلب غل هذة اله كلة اللتغلقة بوقث الوصول إلى اللعلومات: طور aaa‏ 
مستودعات البيانات نظامًا لتحديث البيانات بشكل أكتر تواترّ؛ مما أذَى إلى الاستيداع في الوقت 
المناسب للبيانات» والذي يختلف عن المنهج السابق في التخزين من خلال اعتماد سياسة تحديث 
البيانات على أساس التحديث المطلوب لعناصر البيانات (أَيْ: ليس كل عناصر البيانات تحتاج 
إلى تحديث بشكلٍ فوري). إِنَّ مُستودعَات البيانات ضخمةٌ جداً وهي ميزة هائلة. وأصبح من 
الضروري «استخراج» البيانات الخاصة بالشركة؛ من أجل «اكتشاف» ا معلومات الجديدة واممفيدة 
لتحسين عمليات وممارسات الأعمالء ومن ثم مُصطلحَيْ التنقيب في البيانات والتنقيب في النص. 

ومع تزايد حجم البيانات وأصنافها؛ ظهرت الحاجة إلى المزيد من التخزين وقوة المعالجة. 
les‏ الرغم من أنَّ الشركات الكبيرة لديها الوسائل اللازمة ملعالجة هذه المشكلة؛ فإِنَّ الشركات 
الصغيرة الحجم تحتاج إلى نماذج أعمال أكثر قابليةً للإدارة المالية. وقد أدّتَ هذه الحاجة إلى 
نماذج الخدمات الموجّهة نحو الخدمة والبرامج والبنية التحتية كخدمة تحليل الخدمات. وبالتالي؛ 
تمَكّنت الشركات الصغيرة من الوصول إلى إمكانيات التحليلات حسب الحاجة: وتدفع فقط مقابل 
ما استخدموه. بدلاً من الاستثمار المالي في موارد الأجهزة والبرامج الحاسوبية. 

ومنذ عام ١٠١۲م‏ وحتى الآنء ونحن نشهد نقلة egi‏ أخرى في طريقة رَصْد البيانات واستخدامها. 
وبسبب انتشارٍ استخدام الإنترنت على نطاقٍ واسع؛ ظهرت وسائلٌ جديدة لتوليد البيانات مثل بطاقات 
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تعريف ترددات الراديو [112112]. وعدادات الطاقة الرقمية.ء وسجلات النقر عبر الإنترنت» والأجهزة 
المنزلية الذكية ومُعدَّات المراقبة الصحية القابلة للارتداء» وربما كان أكثرها أهميةٌ الشبكات الاجتماعية 
والتي أذت إلى ظهور بيانات غير مهيكلة, هذه البيانات غنية بالمحتوى؛ ولكنها صعبة التحليل من 
ناحية البرمجيات والأجهزة على حَذَّ سواء. وفي الآونة الأخيرة؛ ظهر مصطلح البيانات الضخمة ليسلّط 
الضوء على التَحَدَّيات التي جلبتها L‏ هذه البيانات الجديدة. وقد تمّ تطويرٌ العديد من التحسينات 
في كلّ من الأجهزة (فعلى سبيل المثال: المعالجة المتوازية على نطاق واسع مع الذاكرة الحسابية الكبيرة 
ehig ky‏ الحوسبة متعددة المعالجات المتوازية تلغاية) والبرمجيات/ الخوارزميات. Hadoop) Jès‏ 
MapReduce ge‏ و.N08Q1)‏ والتي تم تطويرها للتغلّب على تحديات البيانات الضخمة. 

ومن الصعب التنبؤ ما سوف يحدث خلال العق د القادم في مجال التحلي لات وما المصطلحات 
الجديدة التي س تظهر؛ لقد قلَصَ الزمَنُ الفجوة بين نماذج أنظمة المعلومات والتحليلات» وسيس تمر 
في المستقبل القريب رغم أنَّ التحليلات ليست جديدةٌ؛ ولكن شعبيتها تزايدت بشكلٍ ملحوظ مؤخرًا 
وبفضل التزايد الهائل في البيانات الضخمة؛ أصبحت طرق جمع وتخزين هذه البيانات» وأدوات 
البرمجيات البديهية» والرؤى التي تعتمد على البيانات أكثر سهولةً لرجال الأعمال من أي Cs‏ مضى. 
لذلك» وفي خضم المنافسة العالمية أصبحت الفرصة كبيرةٌ لاتخاذ قرارات إدارية أفضل باستخدام البيانات 
والتحليلات لزيادة الإيرادات مع خفض التكاليف من خلال إخراج منتجات أفضل» وتحسين تجربة 
العملاء» واكتشاف الاحتيال قبل حدوثهء وتحسين تفاعل العملاء من خلال الاستهداف والإنتاج حسب 
طلب العميل مع قوة التحليلات والبيانات. ويتزايد عددُ الشركات التي تقوم حالياً بتدريب موظفيها 
على أدوات تحليل الأعمال؛ من أجل تحقيق أكثر فعالية وكفاءة في عمليات صنع القرارات اليومية. 

ويركز القسم التالي على إطار عمل ذكاء الأعمال. وعلى الرغم من أن معظم الناس يتفقون على أن 
ذكاء الأعمال قد تطور إلى تحليلات وعلم البيانات؛ فإن العديد من المورّدين والباحثين لا يزالون يستخدمون 
هذا المصطلح. لذلك يولي القتسم 4-١‏ اهتمامًا بهذا التاريخ من خلال التركيز على ما يُُسمَّى ذكاء الأعمال. 
وبعد القسم التالي» نقدّم التحليلات وسوف نستخدم ذلك كعلامة لتصنيف جميع المفاهيم ذات الصلة. 


أسئلة مراجعة على القسم اك 
-١‏ اذكر ثلاثة من المصطلحات التي سبقت التحليلات. 


7- ما الفرق الأساسي بين النُظُم التي مُسمّى نظم المعلومات الإدارية ونظام دعم القرار ونظم 
المعلومات التنفيذية؟ 


Y‏ هل تطوّر نظامٌ دعم القرار إلى ذكاء أعمال أو العكس؟ 
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٤-١‏ إطار عمل ذكاء الأعمال: 

لقد تمّ تنفيذٌ مفاهيم دعم القرار الواردة في القسمين ١-١‏ و٠-۴‏ بشكل تدريجي» تحت أسماء 
مختلفة من قبل العديد من المورّدين الذين قاموا بإنشاء أدوات وأساليب لدعم القرار. وكما 
ar‏ في القسم 2-١‏ ومع نمو النظم على نطاق المؤسسة؛ تمكّن المديرون من الوصول إلى تقارير 
سهلة الاستخدام تمكّنهم من اتخاذ القرارات بسرعة. وبدأت هذه الأنظمة: التي كانت تُسمّى 
عمومًا نظم المعلومات التنفيذية و815) تقدم تصورًا إضافيّاء وتنبيهات» وقدرات لقياس الأداء. 
وبحلول عام ٠١٠۲م؛‏ ظهرت المنتجات والخدمات التجارية الرئيسة تحت مصطلح ذكاء الأعمال. 


تعريفات ذكاء الأعمال: 

ذكاء الأعمال (81) هو مصطلحٌ شامل يجمع بين البنيات والأدوات وقواعد البيانات والأدوات 
التحليلية والتطبيقات وا منهجيات. ويتزايد عد الشركات التي تقوم حالياً بتدريب موظفيها على 
أدوات تحليل الأعمال؛ من أجل تحقيق أكثر فعالية وكفاءة في عمليات صُنع القرارات اليومية وهناك 
نوع من الارتباك حول ذكاء الأعمال ناتج من موجة الاختصارات والكلمات الطنانة المرتبطة به (على 
سبيل المثال: إدارة أداء الأعمال [8821]). فالهدف الرئيس لذكاء الأعمال؛ هو تمكين الوصول التفاعلي 
وفي بعض الأحيان بشكلٍ فوري إلى البيانات» لتمكين معالجة البيانات؛ وإعطاء مديري الأعمال والمحلّلين 
القدرة على إجراء التحليلات المناسبة. ومن خلال تحليل البيانات التاريخية والحالية» والمواقف» 
والعروض» يستطيع صُناع القرار الحصول على رؤى قيّمة تمكّنهم من اتخاذ قرارات أفضل وأكثر استنارة. 
وتستند عملية ذكاء الأعمال إلى تحويل البيانات إلى معلوماتء ثم إلى قرارات» وأخيرًا إلى إجراءات. 


لمحة تاريخية عن ذكاء الأعمال: 

لقد صيعٌ مصطلح ذكاء الأعمال من قبل مجموعة à Gartner‏ منتصف التسعينيات ومع ذلك 
وكما يشير التاريخ في القسم السابق؛ ob‏ هذا ا مفهوم أقدم من ذلك بكثير. وله جذوره في نظم تقارير 
5 ف السبعينيات. وخلال تلك الفترة؛ كانت نظم التقارير ثابتةء وكانت ثنائية الأبعاد وم تكن لديها 
قدرات تحليلية. às‏ أوائل الثمانينيات؛ ظهر مفهوم نظم المعلومات التنفيذية 5 وقد وسع هذا 
المفهوم الدعم المحوسب لدى كبار المديرين والمديرين التنفيذيين. ومن بين الإمكانات التي قدَّمتها 
التقارير الديناميكية المتعددة الأبعاد (المخصصة أو حسب الطلب) التنبؤ وتحليل الاتجاهات» وتحليل 
التفاصيلء والوصول إلى الحالةء وعوامل النجاح الحرجة. وقد ظهرت هذه الميزات في العشرات من 
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نظرة عامة على ذكاء الأعمال والتحليلات وعلم البيانات 


المنتجات التجارية حتى منتصف التسعينيات» ثم ظهرت نفس القدرات وبعض الإمكانات الجديدة 
تحت اسم ذكاء الأعمال. واليوم؛ يحتوي ذكاء الأعمال الجيد القائم على أساس نظام المعلومات 
المؤسسية على جميع المعلومات التي يحتاجها المسؤولون التنفيذيون في مجال المعلومات. لذلك. تم 
تحويل المفهوم الأصلي لنظام المعلومات التنفيذي 815 إلى ذكاء الأعمال. وبحلول عام 0« ela‏ 
أنظمة ذكاء الأعمال لتشمل قدرات الذكاء الاصطناعي بجانب قدرات تحليلية قوية. ويُوضُح الشكل 
1-١‏ مختلف الأدوات والأماليب التي يمكن إدراجها في نظام ذكاء الأعمال. ويوضح كذلك تطور ذكاء 
الأعمالء وتبين الأدوات المعروضة في الشكل قدرات ذكاء الأعمال وتتوفر هذه القدرات في منتجات 
ذكاء الأعمال الأكثر تطورًا. وبعضها الآخر متخصص في بعض منها فقط. 
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شكل :4-١‏ تطور ذكاء الأعمال (81) 
بنية ذكاء الأعمال: 
تتكوّن بنية نظام ذكاء الأعمال من أربعة مكوّنات رئيسة هي: 
-١‏ مستودعات البيانات مع بيانات مصدرها. 
-Y‏ تحليلات الأعمالء وهي مجموعة أدوات معالجة وتنقيب وتحليل البيانات الموجودة 
في مستودعات البيانات. 
*- نظام إدارة الأعمال لمراقبة وتحليل الأداء. 
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4- واجهة مستخدم (على سبيل المثال: لوحة المعلومات). 
ويوضح الشكل ٠١-١‏ العلاقة بين هذه المكونات. 





الآداء والإستراتيجية بيئة تحليلات الأعمال بينة مستودع البيانات 











source: based on w.eckerson smart companies in the 21st century the secrets of creating. successful 
business intelligent sollutions. the data warehousing inistilute.seattle . wa.2003. p.32 iiiuslration 5 


شكل :٠١-١‏ بنية عالية المستوى لذكاء الأعمال 


أصول ومحركات ذكاء الأعمال: 

من أين أتت الطرق الحديثة المستودع البيانات وذكاء الأعمال؟ وما هي جذورها؟ وكيف تؤثر 
تلك الجذور على الطريقة التي تدير بها المنظمات هذه المبادرات اليوم؟ إن الاستثمارات الحالية في 
تقنية المعلومات تخضع لزيد من التدقيق من حيث تأثيرها على خط الأساس واحتماليتها. وينطبق 
الثيء نفسه على مستودعات البيانات وتطبيقات ذكاء الأعمال التي تجعل هذه المبادرات ممكنة. 

وتضطر المنظمات إلى استيعاب بياناتها وفهمها وتسخيرها لدعم القرارات لتحسين العمليات 
التجارية. فالقوانين والتنظيمات (مثل: قانون ساربينز - أوكسلي لعام )٠٠١7‏ تتطلب الآن من سير 
الأعمال توثيق عملياتهم التجارية والتوقيع على قانونية المعلومات التي يعتمدون عليها وتقديم 
تقرير إلى حاملي الأسهم. وعلاوةً على ذلك؛ أصبحت أوقات دورة الأعمال مضغوطة للغاية وأسرع 
وأكثر استنارةً وأصبحت هناك حاجة لاتخاذ قرار أفضلء وبالتالي» زاد احتياج المديرين إلى المعلومات 
الصحيحة في الوقت المناسب وفي المكان المناسب. وهذا هو شعار النهج الحديث لذكاء الأعمال. 

ويجب على المنظمات أن تعمل بذكاء مع الاهتمام البالغ بإدارة مبادرات ذكاء الأعمال 
Gly i al‏ ضروريًا من جوانب الأعمال. وليس مثيرا للدهشة أن تناصر المنظمات بشكلٍ 
متزايد ذكاء الأعمال في تجسيدها الجديد كتحليلات. وتعرض حالة عملية ١-١‏ أحد تطبيقات 
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نظرة عامة على ذكاء الأعمال والتحليلات وعلم البيانات 


ذكاء الأعمال الذي ساعد العديد من شركات الطيرانء وكذلك بالطبع» الشركات التي تقدم هذه 
الخدمات لشركات الطيران. 
حالة عملية 1١-١‏ 
شركة 521 تساعد عملاءها من خلال لوحات ال معلومات والتحليلات 

$a ls Sabre X 55‏ من الشركات العالمية الرائدة في صناعة الرحلات السياحية. 
وتقوم الشركة بتوفير الخدمات للأشخاص والشركات. وهي تخدمٌ المسافرين 
ووكلاء السفر والشركات ومورّدي خدمة السفر من خلال أربع شركات رئيسة 
هي: «Sabre Airline Solutionss «Sabre Travel Networks «Travelocity‏ 
JS iss .Sabre Hospitality Solutions s‏ البيئة الاقتصادية العاطية المتقلبة الحالية 
تحديات تنافسية كبيرة لصناعة الطيران. وللمُضْيّ قُدما في المنافسة. اعترفت شركة 
OL» Sabre Airline Solutions‏ المديرين التنفيذيين في شركات الطيران يحتاجون إلى 
أدوات مُحسّنة لإدارة قراراتهم التجارية والتخلّص من الإجراءات التقليدية واليدوية التي 
تستغرق وقثًا طويلًا لجمع المعلومات المالية وغيرها من المعلومات اللازمة للمبادرات 
القابلة للتطبيق. وهذا يتيح دعم القرار في الوقت ا مناسب لشركات الطيران في جميع 
أنحاء العالم لتحقيق أقصى قدرٍ من العائدات على المعلومات من خلال أفكار قيادية 
وذكاء قابل للتطبيقء وقيمة للعملاء من البيانات المتنامية. 

قامت شركة 586:6 بتطوير مستودع بيانات سفريات المؤسسة (8/:11011) 
باستخدام تيراداتا للاحتفاظ ببيانات الحجوزات الهائلة. Em‏ تحديث مستودع بيانات 
سفريات المؤسسة بشكلٍ فوري تقريبًا بدفعات تعمل كل ٠١‏ دقيقة. ولجمع البيانات 
من جميع الأعمال التابعة لشركة ١ط8.‏ وتستخدم اة مستودع بيانات سفريات 
المؤسسة لإنشاء لوحات المعلومات التنفيذية التي توفر رؤى تنفيذية لحظية باستخدام 
منصة وممعه0 ذكاء الأعمال -Oracle Goldengats Oracle Data Integrator go‏ 
وتوفر لوحات المعلومات التنفيذية للمديرين وصُناع القرار رفيعي المستوى من شركات 
الطيران والعملاء حلًا آليّا سهل الاستخدام يجمع بين مقاييس الأداء الحساسة بطريقة 
موجزة وتقديم نظرة ثاقبة سريعة بدرجة 7٠١‏ عن صحة شركة الطيران. وفي إحدى 
شركات الطيران توفر لوحات المعلومات التنفيذية لشركة 6م54 للإدارة العليا صورةٌ 
يوميةً ولحظية لمؤشرات الأداء الرئيسة في تطبيق واحد تحل محل العملية التي يتم 
إجراؤها مرةً واحدةً في الأسبوع والتي تستغرق 8 ساعات لتوليد التقرير نفسه من 
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مصادر البيانات المختلفة. إن استخدام اللوحات لا يقتصر على العملاء الخارجيين 
بل تستخدمها 54016 أيضاً لتقييمها للآداء التشغيلي الداخلي. 

وتساعد لوحات المعلومات عملاء ©5365 على الفهم الواضح للبيانات من خلال 
شاشات العرض المرئية التي تتضمّن قدرات تفاعليةء يستبدل العروض التقدهية امسطحة 
ويسمح هراجعة أكثر تركيرا للبيانات بأقل جهد ووقت. هذا يُسهّل حوار الفريق من 
خلال إتاحة البيانات/ المقاييس المتعلقة بأداء المبيعات للعديد من المستفيدين: بما في 
ذلك التذاكر, والمقاعد المباعة والطيران, والأداء التشغيلي بما في ذلك البيانات المتعلقة 
بحركة الطيران والتتبّع. وحجوزات العملاء» والمخازن, والإيرادات عبر توزيع شركة طيران 
متعددة القنوات. وتوفر أنظمة لوحة المعلومات البنية التحتية القابلة للتوسع؛ ودعم 
واجهة ا مستخدم الرسوميةء وتكامل البيانات, والتجميع الذي يمن اممديرين التنفيذيين 
في شركات الطيران من أن يكونوا أكثر إيجابية في اتخاذ إجراءات تؤدي إلى آثار إيجابية 
على الصحة العامة لشركات الطيران التابعة لهم. 

وباستخدام 2811018 الخاص بهاء تستطيع ©5806 كذلك تطوير حلول تحليلية 
وإعداد تقارير أخرى تستندٌ إلى الويب» والتي تتيح الحصول على البيانات من أجل 
الحصول على رؤى العملاء من خلال تحليل الملفات الشخصية للعملاء وتفاعلات 
مبيعاتهم من أجل حساب قيمة العملاء. وهذا يتيح تقسيماً أفضل للعملاء وإحصاءات 
للخدمات ذات القيمة المضافة. 

أسئلة للمناقشة: 

-١‏ ما هي التقارير التقليدية؟ وكيف يتخ استخدامها في المنظمة؟ 

؟- كيف يمكن استخدام التحليلات لتحويل التقارير التقليدية؟ 

- كيف يكن للتقارير التفاعلية أن تساعد الشركات في صُنْع القرار؟ 

ما الذي الذي مكننا أن نتعلمه من هذه الحالة العملية؟ 

تُوضّح هذه الحالة العملية أن المنظمات التي استخدمت تقاريرها في وقتٍ سابق فقط 
لتتبع أعمالها الداخلية وتلبية متطلبات التوافق التي وضعتها الحكومة تتجه الآن نحو 
توليد معلومات ذكية قابلة للتطبيق من بيانات معاملاتها التجارية. وقد أصبحت التقاريرٌ 
أكثر اتساعًا؛ إذ تحاول المنظمات الآن تحليل بيأنات الممعاملات المؤرشفة؛ لفهم التوجهات 
والأنماط الخفية الكامنة التي تمكّنها من اتخاذ قرارات أفضل من خلال اكتساب رؤى حول 
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المجالات التي تنطوي على مشكلات وحلها لمتابعة فرص السوق الحالية والمستقبلية. وقد 
تطورت التقارير إلى تقارير تفاعلية عبر الإنترنت» وهو ما هكن ا مستخدمين من الحصول 
على بيانات سريعة وإنشائهاء مساعدة أدوات التصوير التي لديها القدرة على الاتصال 
بقاعدة البيانات؛ مما يوفر إمكانيات التعمق في البيانات الملخّصة. 

Source: Teradata.com, "Sabre Airline Solutions; Terry, D. (2011), “Sabre Streamlines 
Decision Making” — http://www.Teradatamagazine.com/v11n04/Features/Sabre- 


Streamlines-Decision-Making/(Accessed July 2016). 


استعمال الوسائط المتعددة فى ذكاء الأعمال: 

تتضمّن شبكة جامعة تيراداتا 11071 مقاطع الفيديو (على غرار البرنامج التلفزيوني 051)؟ لتوضيح 
مفاهيم التحليلات à‏ مختلف الصناعات. albis‏ عليها اسم «مقاطع فيديو تقمّي سيناريوهات 
الأعمال 851». وهي ليست لجرد التسلية؛ ولكنها تزوّد الفصل الدراسي ببعض الأسئلة للمناقشة. 
وبالنسبة للمبتدئينء 9( http//www.teradatauniversitynetwork.com/ :JI JUA3Ml‏ 
www.youtube.com/ sl Library/Items/BSI-The-Case-of-the-Misconnecting-Passengers‏ 
Baa as watchtv-NXELSFA. aKA‏ الفيديو الذي يظهر على يوتيوب. وعليك أن تفترض قيامك 
بدور مركز خدمة العملاء المهنية. وقد بدأت الرحلة القادمة في وقتِ متأخرء ومن المرجّح أن يفقد 
العديد من الركاب رحلاتهم. وهناك مقاعدٌُ في رحلة مغادرة واحدة يمكن أن تستوعب اثنين من الركاب 
الأربعة. فأيٌ من الركاب يجب أن تُعطَى إليه الأولوية؟ ويتمٌ إعطاؤك معلومات حول ملامح العملاء 
والعلاقات بشركة الطيران. وهنا قد تتغيرٌ قراراتك عندما تتعلم المزيد عن ملفات التعريف لهؤلاء العملاء. 

شاهد الفيديو وأوقفه كلما لزم الأمرء وأجب عن الأسئلة التي ينبغي أن يُعطَى فيها الأولوية 
للمستفيدين. ثم استأنف مشاهدة الفيديو؛ للحصول على مزيد من ال معلومات. وبعد اكتمال الفيديو 
يمكنك مشاهدة الشرائح المتعلقة بهذ! الفيديو وكيف تم إعداد التحليل على شريحة مُحدَّدة في: 
www.slideshare.net/teradata/bsi-how-we-did-it-the-case-of-the-misconnecting-passengers.‏ 

وتوفّر هذه الرحلة المتعددة الوسائط مثالاً على كيفية مساعدة المعلومات الإضافية المتاحة 
من خلال مشروع مستودع البيانات DW‏ في صُنع القرار. 

على الرغم من أن البعض يساوي بين نظام دعم القرار وذكاء الأعمال؛ فإِنَّ هذه الأنظمة 
ليست في الوقت الحاضر متساويةً. المثير للاهتمام أن نلاحظ أن بعض الناس يعتقدون أن نظام 
دعم القرار 255 هو جزءٌ من ذكاء الأعمال وإحدى أدواتها التحليلية. ويعتقد آخرون أَنَّ ذكاء 
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الأعمال هو حالة خاصة من أنظمة دعم القرار التي تتناول في الغالب إعداد التقارير والتواصل 
والتعاون (شكل من أشكال أنظمة دعم القرار ا موجهة بالبيانات). وثمّة تفسير آخر قال به 
o] 5 a (Watson. 2005)‏ ذكاء الأعمال MI s ls‏ نتيجة لتطؤر مستمرء وعلى هذا النحو؛ فإن 
نظام دعم القرار هو أحد عناصر ذكاء الأعمال الأصلية. وعلاوةً على ذلكء وكما هو مُبِيّن في 
القسم التالي وما بعده؛ نجد أنه وفي العديد من الدوائرء تم دمج ذكاء الأعمال من خلال تحليلات 
مصطلحات جديدة أو علم البيانات. 
معالجة العمليات مقابل المعالجة التحليلية: 

لتوضيح الخصائص الرئيسة لذكاء الأعمال؛ سنقوم أولًا ببيان أن ذكاء الأعمال لا يُعَنُ معالجةٌ 
للمعاملات. إننا جميعًا على دراية بأنظمة المعلومات التي تدعم معاملاتناء مثل أجهزة الصراف 
الآليء والودائع ا مصرفيةء وفحص النقود في متجر البقالةء وما شابهها. وتشارك أنظمة معالجة 
العمليات هذه باستمرار في التعامل مع التحديثات فيما يمكن أن نسميه قواع د البيانات 
التشغيلية. فعلى سبيل المثال: في عملية السحب من أجهزة الصراف «SI‏ نكون بحاجة إلى 
تقليل رصيدنا المصرفي وفقاً لذلك؛ في حين أنَّ الإيداع البنكي يضيف إلى الحساب. ومن المرجّح أن 
تظهر مشتريات متجر البقالة في حساب المتجر من خلال إجمالي المبيعات لهذا اليوم وينبغي أن 
تعكس تخفيضاً مناسباً في المخزون من الأصناف التي اشتريناها وهكذا. وتعالج أنظمة معالجة 
العمليات الفورية هذه (011۶) نشاط الشركة امعتاد والمستمر. وعلى النقيض من ذلك؛ فإن 
مستودع البيانات يكون عادةً نظامًا متميرًاً يوفّر التخزين للبيانات التي سيتم استخدامها للتحليل. 
والقصد من هذا التحليل؛ هو إعطاء الإدارة القدرة على تنظيف البيانات للحصول على معلومات 
عن الأعمال» ويمكن استخدامها لتوفير الدعم التكتيكي أو التنفيذي للقرار؛ إذ تمكن للمديرين 
المباشرين» على سبيل المثال» اتخاذ قرارات أسرع و/أو أكثر استنارة. وسوف نقدَّم تعريقًا أكثر 
iis‏ لمستودع البيانات في الفصل الثاني ولكن يكفي أن نقول بأن مستودعات البيانات تهدف 
إلى العمل مع البيانات المعلوماتية المُستَخدّمة في نظم المعالجة التحليلية الفورية (OLAP)‏ 
ag‏ تخزين معظم البيانات التشغيلية في نظم تخطيط موارد المؤسسة (882) وفي أشقائها 
التكميليين» مثل إدارة سلسلة التوريد pls à ifatt (CRM) Mall öylə, pls gf (SCM)‏ 
معالجة العمليات الفورية 011 585 Qa E.9$‏ معالجة الحاسوب حيث يستجيب الحاسوب 
فورًا لطلبات المستخدمين. alza callo JS Asi‏ وهو سجلٌ محوسب لحدثْ منفصل, مثل 
استلام المخزون أوامر العميل. وبعبارة أخرى؛ تطلب المعاملة مجموعةً من اثنين أو أكثر من 
تحديثات قاعدة البيانات التي يجب أن تكتمل بطريقة كلّ شيء أو لا شيء. 
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إن التصميم الذي يجعل نظام 011۶ هذا فعَالَّا لمعالجة العمليات يجعله غير فعال بالنسبة 
للتقارير والاستعلامات والتحليلات الخاصة بالمستخدم النهائي. وف الثمانينيات» أشار العديدٌ من 
المستخدمين من رجال الأعمال إلى إطاراتهم الرئيسة على أنها «ثقوب سوداء» ÍS OË‏ ا معلومات 
دخلت إليهاء ولكن مم Gl gry‏ منهم على الإطلاق. ويجب أن يبرمج موظفو تقنية المعلومات 
جميع طلبات تقديم التقاريرء في حين أنه هكن إصدار التقارير «المسبقة أو الأكثر استخداما» 
وحدها على أساس مجدولء إن الاستعلام الفوري المخصص مستحيل تقريبًا. وعلى الرغم من أن 
نظم تخطيط موارد المؤسسات القائمة على العميل/ الخادم في التسعينيات كانت أكثر ملاءمة 
لإعداد التقارير؛ فإنها ما زالت بعيدة كل البعد عن الاستخدام المرغوب فيه من قبل المستخدمين 
النهائيين وغير التقنيين لأمور مثل إعداد التقارير التشغيلية والتحليل التفاعلي وما إلى ذلك. dads‏ 
هذه القضايا؛ تمّ إنشاء مفاهيم مستودع البيانات وذكاء الأعمال. 

وتحتوي مستودعات البيانات على مجموعة واسعة من البيانات التي تقدّم صورةً متماسكةٌ 
لأوضاع الأعمال في وقت واحد. وكانت الفكرة هي إنشاء بنية تحتية لقاعدة البيانات التي Uil» cats‏ 
على شبكة الإنترنت وتتضمّن جميع المعلومات من OLTP alil‏ بما في ذلك البيانات التاريخية, 
ولكن أعيد ترتيبها وتنظيمها بطريقة سريعة وفعّالة للاستفسار والتحليل ودعم القرار. إن فصل 
5e OLTP‏ التحليل ودعم القرار تمكّن من الاستفادة من ذكاء الأعمال وهو ما وصفناه في وقتِ سابق. 
التخطيط المناسب والتوافق مع إستراتيجية الأعمال: 

أولاً وقبل كلّ شيء» يجب أن تكون الأسباب الأساسية للاستثمار في ذكاء الأعمال متوافقةٌ مع 
إستراتيجية أعمال الشركة. إِنَّ ذكاء الأعمال ليس مجرد ممارسة تقنية لقسم نظم اممعلومات؛ بل 
يجب أن يكون وسيلةً لتغيير الطريقة التي تقوم بها الشركة التجارية من خلال تحسين عملياتها 
التجارية وتحويل عمليات صُنع القرار؛ لتكون AZ‏ إلى حَدّ كبير على البيانات. ويشير العديدُ من 
استشاريي وممارسي ذكاء الأعمال الذين يشاركون في مبادرات ذكاء الأعمال الناجحة إلى أن إطار 
التخطيط هو شرطٌ مسبقٌ ضروري. يقوم أحد إطارات العمل الذي تم تطويره بواسطة مجموعة 
جارتتر (2004) #عصانة© بتحليل وتخطيط وتنفيذ مكونات الأعمال والمنظمة والوظائف والبنية 
التحتية. وعلى مستوى الأعمال والمستويات التنظيمية؛ يجب تحديدٌ الأهداف الإستراتيجية 
والتشغيلية مع مراعاة المهارات التنظيمية المتاحة لتحقيق تلك الأهداف. ويجب على الإدارة 
العليا أن تنظر في قضايا الثقافة التنظيمية التي تحيط بمبادرات ذكاء الأعمال وحفز تلك المبادرات 
والإجراءات المتعلقة بمشاركة أفضل ممارسات ذكاء الأعمال اممتبعة في الإدارة العليا داخل الشركة 
مع وَضْع الخطط اللازمة لإعداد المنظمة من أجل التغيير. ومن بين الخطوات الأولى في هذه 
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العملية تقييم تنظيم نظام المعلومات ومجموعات مهارات الفئات المحتملة من المستخدمينء 
وما إذا كانت الثقافة قابلةً للتغيير. ومن خلال هذا التقييم» وعلى افتراض وجود مبرر/ ضرورة 
للمُضي قُدُمه بمكن للشركة إعداد خطة عمل مفصلة. وة مسألة حاسمة أخرى لنجاح تنفيذ 
نظم المعلومات وهي دَمْج العديد من مشاريع ذكاء الأعمال (حيث تستخدم معظم المؤسسات 
العديد من مشاريع ذكاء الأعمال) فيما بينها من جانب ومع أنظمة تقنية المعلومات الأخرى في 
المنظمة وشركائها التجاريين من جانب آخر. 
من الحكمة البدهٌ في استخدام ذكاء الأعمال وإنشاء مركز كفاءة ذكاء الأعمال إذا كانت إستراتيجية 
الشركة تتماثى بشكلٍ صحيح مع أسباب مبادرات مستودعات البيانات وذكاء الأعمال» وإذا كان نظام 
ا معلومات قادرًا أو بإمكانه القيام بدوره في مثل هذا المشروع, وإذا كان مجتمع المستخدمين المستهدّف 
موجوداً ولديه الدافعية؛ حينها بإمكان المركز أن يقدم الخدمات التالية (2004 »,عمامة6): 
- يمكن للمركز أن يُوضُّح كيف يرتبط ذكاء الأعمال بالإستراتيجية وتنفيذ الإستراتيجية. 
- يمكن أن يعمل المركرُ على تشجيع التفاعل بين مجتمعات مستخدمي الأعمال المحتملين وتنظيم نظم المعلومات. 
- هكن للمركز أن يعمل كمستودع ومُورّع لأفضل ممارسات ذكاء الأعمال بين مختلف خطوط الأعمال. 
- يمكن للمركز تأسيسٌ معايير للتميّز في ممارسات ذكاء الأعمال وتشجيعها من خلال الشركة. 
- يمكن أن تتعلّم منظمات نظم المعلومات الكثير من خلال التفاعل مع مجتمعات المستخدمين, 
مثل المعرفة حول مجموعة متنوعة من الأدوات التحليلية المطلوبة. 
- يمكّن مستخدمي الأعمال التجارية ومنظمات نظم المعلومات من فهم أفضل للسبب الذي يستوجب 
أن تكون منصة مستودع البيانات مرنةً مما فيه الكفاية لتوفير متطلبات العمل المتغيرة. 
- يمكن أن تساعد حاملي الأسهم المهمينء مثل المديرين التنفيذيين رفيعي المستوى؛ على فهم كيف 
يمكن أن يلعب ذكاءٌ الأعمال دورًا مهمًا. 
ومن عناصر ذكاء الأعمال الأخرى الناجحة قدرته على توفير بيئة فاعلة سنعرضها فيما يلي: 
ذكاء الأعمال الفوري وعند الطلب أصبح متاحاً: 
لقد تزايدت الحاجةٌ إلى الوصول الفوري إلى المعلومات المشتتة بناءً على الطلب من أجل 
سد الفجوة بين البيانات التشغيلية والأهداف الإ تراتيجيةء وهو الأمر الذي أصبح أكثر إلحاحًا. 
ونتيجةً لذلك؛ ظهرت فئةٌ من المنتجات تُسمّى تطبيقات ذكاء الأعمال الفورية. ومن شأن إدخال 
تقنيات جديدة لتوليد البيانات» مثل تقنية RFID‏ وغيرها من أجهزة الاستشعارء أن يؤدي إلى 
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تسريع هذا النموٌ وتلبية الحاجة إلى ذكاء الأعمال بشكلٍ فوري. وتستخدم أنظمة ذكاء الأعمال 
التقليدية قدرًا كبيرَا من البيانات الثابتة التي تمّ استخراجها وتنقيتها وتنزيلها إلى مستودع 
البيانات لإنتاج التقارير والتحليلات. ومع ذلك؛ فإن الحاجة ليست مجرد إعداد التقرير؛ لأن 
المستخدمين يحتاجون إلى مراقبة الأعمال» وتحليل الأداءء وفهم اذا تحدث الأمور. وهذا يمكن أن 
يساعد ا مستخدمين» الذين يحتاجون أن يعرفوا (تقريبًا بشكل فوري) معلومات عن التغييرات في 
البيانات أو توفر التقارير ذات الصلةء والتنبيهات» والإخطار بشأن الأحداث والاتجاهات الناشنة 
في تطبيقات وسائل التواصل الاجتماعي. وبالإضافة إلى ذلك؛ يمكن برمجة تطبيقات الأعمال 
للعمل على ما تكتشفه أنظمة ذكاء الأعمال هذه في الوقت المناسب. على سبيل المثال: قد يقوم 
lib qb eix (SCM)‏ للحصول على المزيد من «الأدوات» عندما يكون المخزون أقلّ 
من حَدَّ معين أو حينما يقوم نظام خدمة العملاء بتنبيه ممثل خدمة العملاء وموظف مراقبة 
الائتمان للتحقق من عملية عبر الإنترنت قيمتها تجاوزت ٠٠٠٠١‏ دولار. 

من الطرق التي يستخدمها ذكاء الأعمال لتوفير البيانات في الوقت المناسب نموذج مستودع 
البيانات الذي تستخدمه أنظمة ذكاء الأعمال التقليدية. وفي هذه الحالة؛ توفْر المنتجات التي 
يقدّمها موردو منصة ذكاء الأعمال المبتكرة حلا موجهًا بالخدمة وبشكل فوري تقريبًاء والذي 
يقوم بتعبئة مستودع البيانات (0۷) بشكل أسرع مما يقوم به التحديث الدوري التقليدي من 
استخراج/ نقل/ تنزيل (انظر الفصل ”). الطريقة الثانية تُسمّى بإدارة نشاط الأعمال (841/4) 
فیت م استخدامه من قبل مورّدي 84M‏ و/أو مورّدي وس طاء 882/1 معّا (مثل: ه520030 أو 
برنامج gag .(Vineyard gİ Tibco 5i Quantive 5l webMethods 5 Vitria sl Iteration‏ 
يتجاوز مستودع البيانات تمامًا ويستخدم خدمات الويب أو غيرها من وسائل الرّصد لاكتشاف 
الأحداث التجارية الرئيسة. ويمكن وَضْع أجهزة مراقبة البرنامج (أو وكلاء الذكاء) على خادم 
منفصل في الشبكة أو في قواعد بيانات تطبيقات العمليات نفسهاء ويمكنهم استخدام الأساليب 
القائمة على العمليات؛ من أجل قياس العمليات التشغيلية بشكل استباقي وبذكاء. 
تطوير أو حيازة أنظمة ذكاء الأعمال: 

edo‏ اليوم العديدٌ من المورّدين أدوات متنوعةً البعض منها مبرمجٌ بشكلٍ كاملٍ ويُطلّق 
عليها 15ا6ط5: وكل ما يجب على المستخدم فعله هو إدخال الأرقام الخاصة به. ويمكن شراء هذه 
الأدوات أو تأجيرها. وللحصول على قائمة بالمنتجات والعروض التوضيحية والمزيد من المعلومات 
عن المنتجات الحاليةء انظر أدلة المنتج على موقع معهد مستودعات البيانات tdwi.org‏ وما 
عليك إلا أن تقوم بتسجيل المستخدم مجانًا. ويتمٌ إنشاء جميع تطبيقات ذكاء الأعمال تقريبًا مع 
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Lads: lg shells‏ المورّدون أنفسهم الذين يقومون بإنشاء حل مخصص للعميل أو العمل مع 
مورّد آخر يستعين بمصادر خارجية. Ó‏ المشكلة التي تواجهها الشركات هي اختيار البديل: الشراء 
أو الإيجار أو الإنشاء. ولكلٌ من هذه البدائل عدة خيارات» ومن بين المعايير الرئيسة لاتخاذ 
القرار؛ هو التحليل وتحليل التكلفة والمنافع. 
الضبط وتحليل التكاليف والمنافع: 

مع زيادة عدد تطبيقات ذكاء الأعمال المحتملة؛ تنشأ الحاجة إلى ضبطها وتحديد أولوياتها. 
وهذه ليست مهمة سهلة بسبب العدد الكبير من الفوائد غير المباشرة؛ إذ يجبٌ تحديد الفوائد 
المباشرة وغير المباشرة. وبطبيعة الحال؛ فإِنَّ ذلك يحدث عندما تكون معرفة تطبيقات مختلفة 
في المنظمات الأخرى ودراسات الحالة مفيدة للغاية. على سبيل المثال: يوفر معهد مستودعات 
البيانات (10101.08) ثروة من المعلومات عن المنتجات والتطبيقات والتطبيقات المبتكرة. ويمكن 
أن تكون هذه المعلومات مفيدةً في تقدير الفوائد المباشرة وغير المباشرة. 
أمن وحماية الخصوصية: 

هذه مسألةٌ مهمة للغاية في تطوير أي نظام محوسبء وخاصةً ذكاء الأعمال الذي يحتوي على 
البيانات التي قد يكون لها قيمة إستراتيجية. وكذلك يجبٌ حماية خصوصية الموظفين والعملاء. 
تكامل الأنظمة والتطبيقات: 

باستثناء بعض التطبيقات الصغيرة؛ يجب تكامل جميع تطبيقات ذكاء الأعمال مع أنظمة 
أخرى» مثل: قواعد البيانات» والأنظمة القديمة, ونظم المؤسسة (خاصةً 132 و0831) والتجارة 
الإلكترونية (البيع والشراء)؛ بل وأكثر من ذلك. وبالإضافة إلى ذلك؟ فإن تطبيقات ذكاء الأعمال 
ترتبط عادةً بالإنترنت وفي أحيان كثيرة بنظم معلومات شركاء الأعمال. 

وعلاوةٌ على ذلك؛ تحتاج أدوات ذكاء الأعمال أحيانًا إلى التكامل والدعم فيما بينها. وقد 
دفعت الحاجة إلى التكامل مورّدي البرامج إلى إضافة قدراتهم باستمرار إلى منتجاتهم. إن العملاء 
الذين يشترون حزمة البرمجيات المتكاملة يتعاملون مع مورّد واحد Jai‏ ولا يحتاجون إلى التعامل 
مع أنظمة أخرى. ولكنهم قد يفقدون مَيْزة إنشاء نظم تتألف من Qa» Ossa‏ سلالة أفضل». 
أسئلة مراجعة على القسم :6-١‏ 
-١‏ عرّف ذكاء الأعمال. 
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؟- اذكر مع الشرح المكونات الرئيسة لذكاء الأعمال. 
+- عرّف 01:185. 
ع- عرّف 1.42آ0. 
-٥‏ اذكر بعض مجالات التنفيذ التي تناولها تقرير #عصاتته0. 
-A‏ اذكر بعض عوامل النجاح الأخرى لذكاء الأعمال. 
0-١‏ نظرة عامة على التحليلات: 
لقد حلت كلمة التحليلات إلى حَذٌَّ كبير محل المكوّنات الفردية السابقة لتقنيات دعم القرار 
المحوسبة التي كانت متوفرةً تحت تسميات مختلفة في الماضي. وفي الواقع؛ فإن العديد من 
الممارسين والأكادهيين الآن يستخدمون كلمة التحليلات بدلا من ذكاء الأعمال. وعلى الرغم من أن 
العديد من المؤلفين والاستشاريين عرّفوها بشكلٍ مختلف قليلاً؛ فقد يُنظر إلى التحليلات على أنها 
عملية وضع قرارات قابلة للتطبيق أو توصيات لاتخاذ إجراءات بناءً على رؤى متولدة من البيانات 
التاريخية. ووفقاً معهد بحوث العمليات وعلوم الإدارة (1N۴0۸5)؛‏ فإنٌ التحليلات تمثل مزيجاً 
من تقنيات الحاسوبء وتقنيات علم الإدارة والإحصاءات لحل مشكلات حقيقية. وبطبيعة الحال؛ 
فقد اقترحت منظمات أخرى كثيرة تفسيراتها ودوافعها للتحليلات. فعلى سبيل المثال: اقترح معهد 
5 شمانية مستويات من التحليلات تبدأ بتقارير موحّدة من النظم الحاسوبية وتوفر هذه التقارير 
وصفاً لما يحدث داخل المنظمة: وقد مكّنتنا التقنيات الإضافية من إنشاء تقارير مُخصّصة بتفاصيل 
أكثر. ويعود التطؤر التالي في إعداد التقارير إلى طلبات البحث من نوع ا معالجة التحليلية الفورية 
التي تسمح للمستخدم بالاستكشاف بشكلٍ أعمق وتحديد مصادر معينة للمشكلات أو الفرص. 
التقنيات المتاحة اليوم لديها القدرة على إصدار تنبيهات لصناع القرار حينما يسوء الأداء على 
سبيل المثالء وقد تكون هذه التنبيهات للمستهلك فيما يتعلق بالطقس أو قضايا أخرى. ولكن 
يمكن على غرار ذلك إنشاء التنبيهات في سياق إعدادات معينة عندما تكون المبيعات أعلى أو أقل 
من مستوى معين خلال فترة زمنية معينة أو عندما يكون المخزون للنتج معين منخفضاً. وكل 
هذه التطبيقات تكون ممكنةٌ من خلال تحليل البيانات التي يتم جمعها من قبل منظمة ماء وقد 
يستلزمٌ هذا التحليل تحليلاً إحصائياً لفهم الأماط بشكل أفضل. ويمكن بعد ذلك اتخاذ خطوة 
أخرى لتطوير التنبؤات أو نماذج للتنبؤ بكيفية استجابة العملاء لحملة تسويقية معينة أو عروض 
خدمات/ منتجات مستمرة. وعندما تكون لدى المنظمة رؤية جيدة ما يحدث وما قد يحدث». 
يمكنها أيضاً أن تستخدم أساليب أخرى لإصدار أفضل القرارات في ظل الظروف القائمة. vicis‏ 
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على ثمانية مستويات للتحليلات ولمزيدٍ من التفاصيل بالإمكان النظر في العرض التوضيحي المقدّم 
-(sas.com/news/sascom/analytics levels.pdf) :11)! de SAS dasa (yo‏ 

ولقد جسَّدّت هذه الفكرة المتمثلة في دراسة البيانات بشكل كامل لفهم ما يحدث» وما 
سيحدث. وكيفية تحقيق أفضل استفادة منها في اقتراح ثلاثة مستويات من التحليلات. وتم 
تحديدٌ هذه المسنويات الثلاثة (المعلوماتية/ المجتمعية/ التحليلية) على أنها وصفيةء وتنبؤية 
وتوجيهية. يعرض الشكل ١١-١‏ عرضاً بيانياً لأنواع التحليل الثلاثةء ويشير إلى أن هذه المستويات 
الثلاثة مستقلةٌ إلى حَدَّ ماه وأن كلاً منها يؤدي إلى الآخر. كما يشير إلى وجود بعض التداخل عبر 
هذه الأنواع الثلاثة من التحليلات. وسواءً كانت مستقلةً أو متداخلةٌ؛ فإن الطبيعة المترابطة 
مختلف أنواع التحليلات واضحة وسيتم شرح المستويات الثلاثة في الأقسام التالية. 





ماذا ينبغى أن أفعل؟ ماذا سيحدث؟ ماذا حدث؟ 
لماذا ينبغى أن أفعله؟ لماذا سيحدث ؟ ماذا يحدث؟ 


الأسئلة 


الأمثلية ‏ ر التنقيب فى البياتات ‏ ر إعداد تقارير الأعمال 
08999 20 التنقيب فى التصوص ‏ لوحات المعلومات 


الأدرات المساعدة 
SNN‏ 


نمذجة القرار >“ اتتغيب فى وسال الاعلامالويب ‏ بطاقات 
النظم الخبيرة / التتبزات d‏ مستودعات البيانات 
أفضل قرارات وتصرفات توقعات مستقبلية دقيقة مشاكل وفرص 
الأعمال الممكنة اللأحداث والنتائج عمل محددة جيدا 3 











الشكل :!١-١‏ أنواع التحليلات الثلاثة 
التحليلات الوصفية: 


تشر التحليلات الوصفية (أو التقارير) إلى معرفة ما يحدث في ا منظمة وفهم بعض الاتجاهات 
والأسباب الكامنة وراء مثل هذه التجارب. ينطوي ذلك على توحيد مصادر البيانات وتوفر 
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جميع البيانات ذات الصلة في شكل يتيح إعداد التقارير والتحليلات المناسبةء عادةً ما يكون 
تطوير هذه البنية الأساسية للبيانات جزءًا من مستودعات البيانات. ومن هذه البنية الأساسية 
للبيانات يمكننا تطويرٌ التقارير المناسبة» والاستعلامات, والتنبيهات» والاتجاهات باستخدام أدوات 
وأساليب إعداد التقارير المتنوعة. 

من التقنيات المهمة التي تشكل لاعباً أساسيًا في مجال التحليلات الوصفية؛ التصويرٌ باستخدام 
أحدث أدوات التصوير في السوقء والتي تمكّننا من استخراج رؤى قوية من عمليات منظماتنا. 
j .(dssbibook.com)‏ 


حالة عملية ۲-١‏ 
شركة سيلفاريس aos moss (Silvaris)‏ باستخدام التحليل hatl‏ وإمكانيات إعداد التقارير الفورية 
تأسّست شركة 5118115 في عام ١٠٠٠م‏ من قبل فريق من اللمتخصّصين في صناعة 
أخشاب الغابات لتوفير التقدّم التقني في قطاع الخشب ومواد البناء. وتُعَد Silvaris‏ 
أولّ منصة للتجارة الإلكترونية في الولايات المتحدة الأمريكية خصيصاً لمنتجات الغابات. 
ويقع مقرّها الرئيس في سياتل. واشنطن. وهي شركة رائدة في مجال توفير المنتجات 
الخشبية الصناعية وفائض مواد البناء. 
تقوم كلهةل5 بِبَيّْع منتجاتها وتّقدّم خدمات لوجيستية دولية إلى أكثر من 70٠١‏ 
عميل. ولإدارة مختلف العمليات ذات الصّلة بالمعاملات؛ أنشأت منصة تداول عبر الإنترنت 
بحقوق ملكية لتتبع تدفق المعلومات المتعلّقة بالمعاملات بين التجار والمحاسبة والائتمان 
والخدمات اللوجستية. وقد أتاح ذلك للشركة تبادل المعلومات بشكلٍ فوري مع عملائها 
والشركاء. ولكن نظراً للتغير السريع في أسعار المواد؟ أصبح من الضروري أن تحصل Silvaris‏ 
على عرض فوري للبيانات دون الحاجة إلى نقل وتنسيق البيانات في تقرير منفصل. 
وبدأت 315 بالاستعانة بشركة تابلوه (Tableau)‏ لقدرتها على التواصل مع 
البيانات الحية وتصويرها. وبسبب لوحات المعلومات التي أنشأتها تابلوه (Tableau)‏ 
والتي تتسم بسهولة الفهم والشرح؛ بدأت (Tableau) ogلJıİڌ plختlڊ Silvaris‏ 
لأغراض إعداد التقارير. وساعد ذلك 5117615 في سحب المعلومات بسرعة من البيانات 
وتحديد القضايا التي تؤثر على أعمالها. ونجحت ءاعه S1!‏ قي إدارة الطلبات عبر الإنترنت 
مقابل الطلبات الأخرى بمساعدة التقارير التي أنشأتها تابلوه (نه12016). والآن؛ تقوم 
5 بتتبّع الطلبات عبر الإنترنت المقدمة من قبل العملاء وتعرف متى ترسل دفعات 
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تجديد للعملاء الذين يقومون بالشراء عبر الإنترنت. وأيضاً يمكن محللي ass Silvaris‏ 
الوقت من خلال توليد لوحات معلومات بدلاً من كتابة مئات الصفحات من التقارير 
باستخداع تابلوه (دهعاطة1). 

أسئلة للمناقشة: 

3Silvaris ما التحدي الذي واجهته‎ -١ 

As -Y‏ حلت 35 مشكلتها باستخدام تصوير البيانات مع تابلوة (ئده180[6)؟ 

ماذا يمكننا أن نتعلم من هذه الحالة العملية: 

تحتاج العديد من الصناعات إلى تحليل البيانات بشكل فوري. ويتيح التحليلٌ 
الفوري للمحللين تحديد القضايا التي تؤثر على أعمالهم. ويكون التصويرٌ أحيانًا أفضل 
طريقة لبدء تحليل تيارات البيانات الحية. وتُّعَدُ تابلوه (ناةءاطة1) إحدى أدوات 
تصوير البيانات ذات القدرة على تحليل البيانات الحية دون نقل البيانات الحية إلى 
تنسيق تقارير منفصل. 
Sources: Tableau.com, "Silvaris Augments Proprietary Technology Platform with‏ 
Tableau's Real-Time Reporting Capabilities" http://www.tableau.com/sites/default/‏ 
files/case-studies/silvarisbusiness-dashboards 0.pdf (accessed July 2016); Silvaris.‏ 

com, "Overview; http://www.silvaris.com/About/(accessed July 2016).‏ 
حالة عملية ۳١-١‏ 
شركة سيمنس (51672685) تقلّل التكلفة باستخدام تصوير البيانات 

شركة سيمنس (Siemens)‏ 2( شركة أطانية مقرّها في برلين. أطانياء وهي إحدى 
كبرى الشركات في العام التي ترگز على مجالات الكهرباء والسيارات» والرقمنة. 
وتحقق إيرادات سنوية تبلغ ١لا‏ مليار يورو. 

ms‏ 6 تنفيذ مجموعة التحليلات المرئية لشركة سيمنس (51473685) بحلول التقارير 
الشاملة والاستشارات فيما يتعلق بجميع احتياجات ذكاء الأعمال الداخلية لشركة سيمنس 
(Siemens)‏ وكانت هذه المجموعة تواجه تَحَذَّياً متمثلاً في توفير حلول إعداد التقارير إلى 
منظمة سيمنس (516603625) بألكامل عبر الأقسام المختلفة مع الحفاظ على التوازن بين قدرات 
الحوكمة والخدمة الذاتية. وكانت sd ñas J| izlo (Siemens) guins w åS ph‏ من 
تحليل الحالات المتعددة لاستطلاعات آراء العملاء والعمليات اللوجيستية: وإعداد التقارير 
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المالية. وكان لا بد أن تكون هذه المنصة سهلة الاستخدام لموظفيها؛ حتى lys‏ من استخدام 
هذه البيانات للتحليل واتخاذ القرارات. وبالإضافة إنى ذلك؛ يجب أن تتكامل المنصة بسهولة 
مع أنظمة سيمنس (58120625) الحالية» وأن تمنح الموظفين تجربة استخدام سلسة. 

بدأت الشركة في الاستعانة بشركة Dundas BI‏ وهي موردٌ عالمي رائدٌ لحلول ذكاء 
الأعمال وحلول التمثيل البصري للبيانات. وقد سمح ذلك لشركة سيمنس (Siemens)‏ 
بإنشاء لوحات معلومات تفاعلية منت شركة سيمنس «3L SS] is (Siemens)‏ 
المشكلات مبكرًاء وبالتالي توفير قدر كبير من المال. وساعدت لوحات المعلومات التي 
طوّرتها 81 250835 شركة سيمنس Jis alil 5e dile VI Je (Siemens)‏ كيف تؤثر 
معدلات العرض المختلفة في المواقع المختلفة على العملية؛ مما ساعدها على تقليل زمن 
دورة الأعمال بمقدار 11“ وتكلفة الخردة بنسبة هلالإ. 

أسئلة للمناقشة: 

FASL OW (Siemens) ما التحديات التي واجهتها مجموعة سيمنس‎ -١ 


؟- كيف ساعدت أداة تصوير البيانات من 81 1008025 شركة سيمنس (Siemens)‏ 
à‏ خفض التكلفة؟ 

of US$ lo‏ نتعلم من هذه الحالة العملية: 

تحتاج العديدٌ من المنظمات إلى أدوات lys‏ من تحليل بياناتها المتوفرة في أقسام 
متعددةء هذه الأدوات تساعد في تحسين أداء عمل المنظمات. وجَعْل عملية اكتشاف 
البيانات شفافة بالنسبة للمستخدمين؛ لتمكينهم من تحديد مشكلات الأعمال بسهولة. 
Sources: Dundas.com, "How Siemens Drastically Reduced Cost with Managed BI‏ 
Applications; http://www.dundas.com/resource/getcasestudy?caseStudyName-09-03-‏ 
2016-SiemensX2FDundas-BI-Siemens-Case-Study.pdf (accessed July 2016); Wikipedia.‏ 


org, "SIEMENS; https;//en.wikipedia.org/wiki/Siemens (accessed July 2016); Siemens. 
com, "About Siemens; http://www.siemens.com/about/en/(accessed July 2016). 


التحليلات التنبؤية: 

تهدف التحليلات التنبؤية إلى تحديد ما يمكن أن يحدث ف المستقبلء وتعتمد هذه التحليلات 
على الأماليب الإحصائية بالإضافة إلى الأماليب الأخرى التي تمّ تطويره ا حديثًا والتي تندرج 
تحت الفئة العامة التنقيب في البيانات. وتهدف هذه التقنيات إلى القدرة على التنبق بما إذا 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري M‏ 


الفصل الأول 


كان من المرجح أن ينتقل العميلٌ إلى المنافسينء وماذا يجب على العميل شراؤه بعد ذلك Gbg‏ 
مقدارء وما هي العروض الترويجية التي قد يستجيبٌ لها العميلء وما إذا كان هذا العميل جديراً 
بالثقة الائتمانية أم لاء وما إلى ذلك. العديدٌ من التقنيات تُستخدّم في تطوير تطبيقات التحليلات 
التنبؤية بما في ذلك خوارزميات التصنيف المختلفة. فعلى سبيل المثالء وكما سنرى في الفصلين 
الرابع والخامسء يمكننا استخدام تقنيات التصنيف مثل الانحدار اللوجستيء ونماذج شجرة 
القرارات» والشبكات العصبية للتنبؤ بمدى جودة الصور المتحركة أمام شباك التذاكر. وهكننا 
أيضاً استخدامٌ خوارزميات التجميع لتقسيم العملاء إلى مجموعات مختلفة؛ حتى يكون بالإمكان 
استهدافهم بعروض ترويجية مُحدّدة لهم. وأخيرآً هكننا استخدامٌ أساليب الترابط في المجتمعات 
لتقدي ر العلاقات بين السلوكيات الشرائية ا مختلفة أيّ: إذا اشترى أحد العملاء منتجًا ما؛ فما 
الذي قد يشتريه العميل أيضاً؟ هكن أن يساعد هذا التحليل بائع التجزئة في التوصية أو الترويج 
للمنتجات ذات الصلة. على سبيل المثال؛ فإن أيّ بحث as gu Amazon.com dle gaia os‏ 
أن يقترح بائعٌ التجزئة أيضاً منتجات مشابهة أخرى قد يهتم بها العميل. وسنقوم بدراسة هذه 
الأساليب وتطبيقاتها في الفصول من الثالث إلى السادس. وتوضّح الحالة العملية 6-١‏ إحدى هذه 
التطبيقات في الألعاب الرياضية. 
حالة عملية ٤-١‏ 
تحليل الإصابات الرياضية 
إن أي نشاط رياضي يكون عُرضةٌ لوقوع إصابات وإذا م يتم التعامل مع الإصابات 

بشكلٍ صحيح؛ فقد يتضرّر الفريق. ويمكن أن يساعد استخدام التحليلات لفهم الإصابات 

في الحصول على إحصاءات قيّمة من شأنها تمكين المدربين وأطباء الفريق من إدارة 

تكوين الفريق» وفهم قدرات اللاعبين» والمساعدة في نهاية المطاف في اتخاذ القرارات 

الأفضل بشأن اللاعبين الذين رها يكونوا متاحين للعب في أي وقت. 

وفي دراسة استطلاعية؛ قامت جامعة أوكلاهوما الحكومية بتحليل الإصابات 

الرياضية بكرة القدم الأمريكية باستخدام التقارير والتحليلات التنبؤية. واتبع المشروع 

منهجية CRISP-DM‏ (التي سنعرضها في الفصل الرابع)؛ لفهم مشكلة تقديم توصيات 

بشأن إدارة الإصاباتء وفهم عناصر البيانات المختلفة التي تم جمعها حول الإصابات 

وتنظيف البيانات وتطوير تصويرات لجذب استدلالات مختلفة وبناء تحليلات إدارة 

الآداء لتحليل فترة التئام الجروحء وقواعد تسلسل الرسم؛ للتنبؤ بالعلاقات بين الإصابات 

ومختلف أجزاء الجسم المصابة بالإصابات. 
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وتتآلف مجموعة بيانات الإصابات من أكثر من 07٠‏ سجل إصابة في كرة القدم, 
والتي تم تصنيفها في إطار المتغيرات الخاصة بالإصابة إلى: الجزء من الجسم/ موقع 
الجسم/ الشكل الجانبيء والإجراء المتخذ. والشّدة نوع الإصابةء بداية الإصابة وتواريخ 
الشفاء. والمتغيرات الخاصة باللاعب/ الرياضة إلى: بطاقة تعريف اللاعب» ومركز اللاعب 
في الملعب, والنشاط والبداية وموقع المباراة. وتم حسابُ وقت الشفاء من الإصابة لكل 
سجل؛ إذ تمّ تصنيفها إلى مجموعات مختلفة من الفترات الزمنية: ١-١‏ شهر. ۲-١‏ شهرء 
aal € Y‏ 5-6 أشهرء و" أشهر- لا شهرًا. 

وتم إنشاءٌ تصويرات مختلفة؛ لاستنتاج معلومات من مجموعة بيانات الإصابات التي 
تصوّر فترة الشفاء المرتبطة بمراكز اللاعبين وشدة الإصابات وفترة الشفاء. PARU gall‏ 
والفترة الزمنية للشفاء المرتبطة بهاء والإصابات الكبيرة التي تصيبٌ أجزاء الجسم. وما إلى ذلك. 

وتم بناءٌ نماذج الشبكات العصبية لكل فئة من فئات الشفاء باستخدام 
Hg IBM SPSS Modeler‏ من اممتغيرات المتوقعة: الحالة الراهنة للإصابةء الشدةء 
جزء الجسم» موقع الجسم» نوع الإصابة» النشاطء موقع الحدثء الإجراء المتخذ, والموقف. 
وكان نجاح تصنيف فئة الشفاء جيداً جداً؛ إذ كانت الدقة 1/9,7/. ويناءً على التحليل تم 
اقتراح العديد من توصيات الأعمال؛ منها استخدامٌ المزيد من مُدخلات المختصين من بداية 
الإصابة بدلاً من السماح مموظفي غرفة التدريب بفحص اللاعبين المصابين. وتم تدريبُ 
اللاعبين في المراكز الدفاعية لتجنب الإصابة» وممارسة التدريب على آليات فحص السلامة. 

أسئلة للمناقشة: 

-١‏ ما هي أنواع التحليلات المطبّقة في تحليل الإصابات؟ 

۲- كيف تساعد التصويراث في فهم البيانات وتقديم رؤى إلى البيانات؟ 

#- ما هي مشكلة التصنيف؟ 

-٤‏ ما الذي يمكن اشتقاقه عن طريق إجراء تحليل تتابعي؟ 

ما الذي يمكننا تعلّمه من هذه الحالة العملية؟ 

وبالنسبة لأيّ مشروع تحليلات؛ من المهمٌ دائماً فهم نطاق الأعمال والحالة الراهنة 
لمشكلة الأعمال من خلال تحليل مُوسّع للمورد الوحيد وهو البيانات التاريخية. وغالباً 
ما توفر عمليات التصوير المري أداةً رائعةً لاكتساب الأفكار الأوّلِية للبيانات» والتي يمكن 
تحسينها بشكل أكبر استنادًا إلى آراء الخبراء لتحذيد الأهمية الجوهرية لعناصر البيانات 
ذات الضّلة بالمشكلة. كما تساعد المعلومات المرئية في توليد أفكار لمشكلات غامضة. والتي 
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يمكن متابعتها في بناء رؤى إدارة «slot‏ والتى oS‏ أن تساعد المنظمات في ge‏ القرار. 
Source: Sharda, R., Asamoah, D., & Ponna, N. (2013). "Research and Pedagogy in‏ 
Business Analytics: Opportunities and Illustrative Examples." Journal of Computing‏ 
and Information Technology, 21(3), 171182-.‏ 


التحليلات التوجيهية: 


تُسمّى الفئة الثالثة من التحليلات بالتحليلات التوجيهية» والتي تهدف إلى التعرّف على ما يجري 
بالإضافة إلى التوقعات المحتملة واتخاذ القرارات؟ لتحقيق أفضل أداء ممكن. وقد تمت دراسة هذه 
المجموعة من الأساليب تاريخيًا تحت مظلة التقارير التشغيلية أو علوم الإدارة وتهدف بشكل عام 
إلى تحسين أداء النظام. والهدف هنا هو تقديم قرار أو توصية بخصوص إجراء مُحدَّد. وقد تكون 
هذه التوصيات على شكل (نعم/ لا) لاتخاذ قرار مرتبط بشكل مُحدَّد لكل مشكلةء أو مبلغ معين 
(على سبيل المثال: سعر بند معين أو سعر الشحن)» أو مجموعة كاملة من خطط الإنتاج. وقد تُعرَض 
القرارات على صانع القرار في تقرير أو يمكن استخدامها مباشرةٌ في نظام قواعد القرار الآلي (كما هو 
الحال في أنظمة تسعير شركات الطيران). وبالتالي؛ يمكن أيضاً تسمية هذه الأنواع من التحليلات 
بتحليلات القرار أو التحليلات المعيارية. وتُقدَّم الحالة العملية 1,0 مثالاً على مثل هذه التطبيقات 


التحليلية المسبقةء وسوف نتعرف على بعض جوانب التحليل التوجيهي في الفصل السادس. 


حالة عملية 0-١‏ 
شركة ستيل بار (822 ا5]6) ا متخصصة تستخدم التحليلات لتحديد تواريخ تنفيذ 
التزاماتها وفقاً للموارد المتاحة 

هذه الحالة العملية مرتبطةٌ بنا جميعاً فقد كانت شركة ستيل بار (802 8]©01) 
لا ترغب في الكشف عن اسمها (أو حتى مجال عملها الدقيق) تواجه مشكلة كبرى 
تتمثل في اتخاذ القرارات بشأن مخزون المواد الخام الذي تستخدمه لإرضاء العملاء؛ 
إذ تقوم هذه الشركة بتوفير قضبان حديدية مُخصّصة لعملائها. وقد تقوم بتقطيع 
القضبان إلى أشكال أو أحجام مُحدَّدةء وقد تحتوي على مواد فريدة ومتطلبات تشطيب؛ 
إذ تقوم الشركة بشراء المواد الخام من جمي ع أنحاء العام وتخزينها في مستودعهاء 
وعندما يتصل عميلٌ محتمل بالشركة لطلب عرض أسعار القضبان ا متخصصة وما يرتبط 
بذلك من بيانات (التكوين» أصل اممعدن» الجودة. الأشكالء الأحجام... إلخ)» وعادةٌ ما 
يكون لدى مندوب المبيعات قليلٌ من الوقت لتقديم مثل هذا السعر ها ف ذلك التاريخ 
الذي يمكن فيه تسليم المنتج وبطبيعة الحالء الأسعار. وما إلى ذلك» ومن ثم يجب اتخاذ 
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قرارات بشأن الوفاء بالالتزامات التاريخية, والتي تُحدّد في الوقت ا مناسب التواريخ التي 
يمكن أن يتمّ تسليمٌ المنتجات التي طلبها العملاء. ويُطْلّب من مندوب المبيعات اتخاةٌ 
مثل هذه القرارات من خلال تحليل التقارير حول المخزون المتاح للمواد الخام. وقد 
تكون بعض المواد الخام المتوفرة قد التزم المندوب بالفعل بتسليمها؛ تلبيةٌ لطلب عميل 
آخر. وبالتالي؛ قد لا يكون المخزون الموجود في المخزن متاحاً بالفعل. ومن ناحية أخرى؛ 
قد تكون هناك مواد خام من المتوقع تسليمها في المستقبل القريبء ويمكن استخدامها 
أيضاً لتلبية طلب مُقدَّم من هذا العميل المحتمل. وأخيراً؛ قد تكون هناك فرصة أيضاً 
لتحصيل رسوم على طلبٍ جديدٍ عن طريق إعادة تخصيص المخزون الذي تمّ الالتزامُ 
به مسبقا لتلبية هذا الطلب الجديد مع تأجيل الطلب الذي تم الالتزامُ به بالفعل. 
وبالطبع؛ فإنه يجب أن تستند هذه القرارات على تحليل التكلفة والعائد لتأخير طلب 
سابق. وبالتالي؛ يجب أن يتمكن النظام من سحب البيانات بشكل لحظي من بيانات 
المخزون, والطلبات المجمّعة, والمواد الخام الواردة. وقيود الإنتاج وما إلى ذلك. 
ولدعم هذه القرارات الصادرة بناءً على الوعد وفقاً للمتاح؟ تمّ تطويرٌ نظام دعم 
القرار 155 الفوري؛ من أجل تخصيصٍ أمثل للمخزون المتاح ولدعم تحليل ماذا - لو 
الإضافي. ويستخدم نظام دعم القرار مجموعةً من نماذج البرامج المختلطة والتي يتم 
lo‏ باستخدام البرامج التجارية. كما أدرجت الشركة نظام دعم القرار في نظام تخطيط 
موارد المؤسسة الخاصة بها لتسهيل استخدامها لتحليلات الأعمال. 
أسئلة للمناقشة: 
ole] A IU -Y‏ تخصيص المخزون من عميلٍ إلى آخر؛ قضيةٌ رئيسةً للمناقشة؟ 
۲- كيف يمكن أن تساعد أنظمة دعم القرار في اتخاذ هذه القرارات؟ 
Source: Pajouh Foad, M., Xing, D., Hariharan, S., Zhou, Y., Balasundaram, B.,‏ 
Liu, T., & Sharda, R. (2013). “Available-to-Promise in Practice: An Application of‏ 
Analytics in the Specialty Steel Bar Products Industry." Interfaces, 43(6), 503517-.‏ 
http://dx.doi.org/10.1287/inte.2013.0693 (accessed July 2016).‏ 
التحليلاث المطبّقة على المجالات المختلفة: 
لقد أنتجت تطبيقاتٌ التحليلات في قطاعات الصناعة المختلفة العديد من المجالات ذات ALA‏ 
أو على الأقل التعبيرات الشائعة اليوم. ومن المألوف تقريباً أن نربط كلمة تحليلات بأيّ صناعة 
أو بيانات وبالإضافة إلى التصنيف العام لتحليلات النص» والتي تهدف إلى الحصول على قيمة من 
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النص (سيتم دراستها في الفصل الخامس». أو تحليلات الويب والتي تهدف إلى تحليل بيانات 
الويب؛ فقد تمّ تطويرٌ العديد من التحليلات المتعلقة بمشكلة أو صناعة معينة. كما تمّ تطويرٌ 
التحليلات الخاصة بالعديد من المهن/ المجالات الخاصة بالصناعة أو المسائل الخاصة بالمشكلات. 
ومن أمثلة هذه المجالات تحليلاثُ التسويقء وتحليلات التجزئة» والنظريات الاحتياليةء وتحليلات 
النقلء والتحليلات الصحيةء والتحليلات الرياضيةء وتحليلات المواهب. والتحليلات السّلوكية: وما 
إلى ذلك. فعلى سبيل المثال: قدَّم القسم ١-١‏ عبارة التحليلات الرياضية. ويمكن أيضاً تسمية 
الحالة العملية ١-١‏ دراسة حالة في تحليلات شركات الطيران» وسيّقدّم القسم التالي التحليلات 
الصحية وتحليلات السوق على نطاق واسع. وبمعنى دقيق يتم تصنيفٌ أي تحليل منهجي 
للبيانات في قطاع معين على أنه تحليلات ««(املأً الفراغات)». وعلى الرغم من أن هذا قد يؤدي 
إلى زيادة حجم مفهوم التحليلات؛ فإِنَّ الفائدة هي أن المزيدَ من الناس في صناعات مُحدّدة 
سيدركون قوة وقدرات التحليلات. كما يدفع إلى التركيز على الملتخصصين الذين يطوّرون ويطبّقون 
مفاهيم التحليلات في قطاع رأسي. وعلى الرغم من أنَّ العديد من الأساليب لتطوير تطبيقات 
التحليلات قد تكون شائعة؛ فان هناك مشكلات فريدة في كل شريحة عمودية تؤثر على كيفية 
جمع البيانات» ومعالجتهاء وتحليلهاء وتنفيذ التطبيقات. وهكذا؛ ف إن التمييز بين التحليلات 
المستندة إلى التركيز العمودي؛ Sail Soo‏ الإجمالي للانضباط. 
التحليلات أو علم البيانات: 

حتى في الوقت الذي يحظى فيه مفهومٌ التحليلات بمزيد من الاهتمام في دوائر الصناعة والأوساط 
الأكادهية؛ تم إدخالٌ مصطلح آخر وأصبح شائعاً وهو مصطلح علم البيانات» والممارسون لهذا العلم 
يُطلق عليهم «علماء بيانات»» وأحياناً يُنسَب إنشاء مصطلح علم البيانات إلى (D. J. Patil) Jb‏ 
LinkedIn j—‏ وكانت هناك بعض المحاولات لوصف الاختلافات بين محلل البيانات وعلماء 
البيانات (على سبيل المثال !133 , : emc.com/collateraliaboutinews/emc-data-science-‏ 
gag -(study-wp-pdf‏ هذه الآراء أن محلل البيانات هو مجرد مصطلح آخر للمهنيين الذين كانوا 
يقومون بعمليات ذكاء الأعمال في شكل تجميع البيانات وتنظيفها وإعداد التقاريرء وأحياناً بعض 
التصويرء وتشمل مجموعات مهاراتهم. وشملت مجموعات مهاراتهم إكسل Excel‏ وبعض معارف 
SQL‏ وإعداد التقارير. ويمكنك التعرُف على هذه القدرات على أنها تحليلات وصفية أو تقارير. 
deg‏ النقيض من ذلك؛ فإِنَّ عالم البيانات مسؤولٌ عن التحليل التنبؤي والتحليل الإحصائي» والأدوات 
التحليلية والخوارزميات الأكثر تقدماً. وقد يكون لديه معرفةٌ أعمق بالخوارزميات وقد تحت 
تصنيفات مختلفة كالتنقيب في البيانات» أو اكتشاف المعرفة» أو تعلّم الآلة. وقد يحتاج بعض هؤلاء 
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الباحثين إلى معرفة برمجة أكثر عمقاً؛ ليكونوا قادرين على كتابة الكود لتنظيف/ تحليل البيانات 
في اللغات الحالية المعتمدة على الويبء مثل لغة 1278 أو همطاز5, واللغات الإحصائية مثل 8. 
كما يحتاج العديدُ من محترفي التحليلات إلى بناء خبرة كبيرة في النمذجة الإحصائية, والتجريب» 
والتحليل. ومرةً أخرى؛ ينبغي أن يدرك قراؤنا أن هذه المصطلحات تندرجُ تحت مظلة التحليلات 
التنبؤية والتوجيهية. ومع ذلك؛ تشتمل أيضاً التحليلات التوجيهية على خبرات أكثر أهميةً في تقارير 
التشغيل بما في ذلك الأمثلية والمحاكاة وتحليل القرار وما إلى ذلك. ومن المرجّح أن يطلق على أولئك 
الذين يعملون على هذه الحقول علماء البيانات بدلاً من محترفي التحليلات. 

إِنَّ وجهة نظرنا في التمييز بين التحليلات bleg‏ البيانات تكمُنُ في درجة المعرفة والمهارات الفنية 
أكثر من الوظائف. ويبدو أنَّ برامج علوم الحاسوب والإحصاء والرياضيات التطبيقية تفضّل تسمية 
علم البيانات» مع الاحتفاظ بتسمية التحليلات الخاصة بالمهنيين العاملين JS Lao‏ أكبر. وكمثالٍ 
آخر على ذلك؛ اقترح المتخصصون في الفيزياء التطبيقية استخدام علم الشبكة كمصطلح لوصف 
التحليلات التي تتعلق بمجموعات من الناس؛ كالشبكات الاجتماعية.ء وشبكات سلاسل التوريده 
وما إلى ذلك. انظر: gbo LS ule gbX) http;/barabasi.com/networksciencebook/‏ 
متطوّر حول هذا ا موضوع. 

وإذا صرفنا النظرٌ عن الاختلاف الواضح في مجموعة المهارات الذي يمتلكها مَنْ يقومون بإجراء 
تحليلات وصفية وإعداد التقارير فقط مقابل أولئك الذين ينخرطون في القيام بأنواع التحليلات 
الثلاثة؛ فإن التمييز بين مصطلح التحليلات وعلم البيانات يصبح غامضاً. ونلاحظ أن خريجي 
برامج التحليلات لدينا يكونون مسؤولين عن مهام تتوافق بش كل أكبر مع مهام علماء البيانات» 
وليس مجرد فقط تقديم تقارير تحليلية. هذا الكتاب يهدف بوضوح إلى إدخال قدرات ووظائف 
جميع أنواع التحليلات» والتي تشمل علم البيانات وليس مجرد تقاري ر التحليلات» ومن الآن 
فصاعداً سنستخدمٌ التحليلات وعلم البيانات بشكلٍ متبادل. 
أسئلة مراجعة على القسم :0-١‏ 
-١‏ عرّف التحليلات. 
؟- ما هي التحليلات الوصفية؟ وما هي الأدوات المتنوّعة المُستخدّمة في التحاليل الوصفية؟ 
-Y‏ كيف تختلف التحليلات الوصفية عن التقارير التقليدية؟ 
-٤‏ ما هو مستودع البيانات؟ وكيف يكن لتقنية مستودعات البيانات المساعدة في تمكين التحليلات؟ 
-٥‏ ما هي التحليلات التنبؤية؟ كيف يكن للمنظمات استخدامٌ التحاليل التنبؤية؟ 
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7- ما هي التحليلات التوجيهية؟ ما هي أنواع المشكلات التي يمكن حلَّها عن طريق التحليلات التوجيهية؟ 
۷- عرف النمذجة من منظور التحليلات. 

-A‏ هل من الجيد Jal lal‏ الهرمي للتحليلات الوصفية والتنبؤية قبل تطبيق التحليلات التوجيهية؟ 
-٩‏ كيف هكن أن تساعد التحليلات في اتخاذ القرار الموضوعي؟ 


1-١‏ أمثلة على التحليلات في مجالات مختارة: 


في الفصول المتنوّعة لهذا الكتاب سنتطرّق للعديد من أمثلة تطبيقات التحليلات» وهذا هو 
أحد الطرق الرئيسة المُستخدّمة في هذا الكتاب (التعرض - Ma (Exposure‏ القسم سنلقي 
الضوء على مجالين من ا مجالات المهمة لتطبيق التحليلات والتي حققت نجاحاً ملحوظاً؛ وهما: 
الرعاية الصحية» وبيع التجزئة. 
تطبيقات التحليلات في الرعاية الصحية - أمثلة u٣”‏ 1: 

على الرغم من أنَّ تحليلات الرعاية الصحية تُعطّي مجموعةً واسعةٌ من التطبيقات من الوقاية 
إلى التشخيص إلى العمليات الفعّالة ومَنْع الاحتيال؛ فإننا نركّز على بعض التطبيقات التي 3& 
تطويرّها في شركة تأمين صحي رئيسة:؛ ووفقاً لما ذكره موقع الشركة على الإنترنت: «تتكامل 
إستراتيجية الشركة لتقديم الرعايةء وتجربة الأعضاء والرؤى الإكلينيكية ورؤى المستهلك؛ بهدف 
تشجيع المشاركة» وتغيير السلوك, والتواصل الإكلينيكي الاستباقي والتعافي». وينطوي تحقيقٌ هذه 
الأهداف الإستراتيجية على استثمارات كبيرة في تقنية المعلومات بشكلٍ ele‏ والتحليلات بشكلٍ 
خاص. ]9 Brian LeClaire‏ هو نائب الرئيس ورئيس قسم المعلومات في 0322دا1؟. وهي شركة 
تأمين رئيسة في الولايات المتحدة. وحاصلٌ على الدكتوراه في 2115 من جامعة أوكلاهوما. وقد 
دافع عن التحليلات كمؤثر تنافسي في 1110208 كما شارك في إنشاء مركز للتميّر في التحليلات. 
ووصف المشاريع التالية بأنها أمثلة على مبادرات 511:38 في نطاق التحليلات التي يقودها 
Vipin Gopal‏ رئيس التحليلات الإكلينيكية في -Humana‏ 
مثال١:‏ منع حوادث سقوط كبار السن - مدخل تحليلي: 

dle 10 الإصابة نتيجةٌ للس قوط خطراً صحيًا كبيراً لكبار السن الذين يبلغون من العمر‎ iÈ 
إن حوادث السقوط هي أيضاً‎ ele JS فهم أكثر من ثلث من يصابون في حوادث سقوط‎ 
العامل الرئيس لكل من الإصابات القاتلة وغير المميتة بالنسبة لكبار السن؛ إذ يؤدي ذلك إلى‎ 
0١ زيادة خطر الإعاقة بنسبة تصل إلى‎ 
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JS as‏ تكاليفٌ هذه الإصابات عبئاً كبيراً على نظام الرعاية الصحية بالولايات المتحدة 
الأمريكية؛ إذ بلغت التكاليف المباشرة للسقوط بنحو ١6‏ مليار دولار في عام ۴٠١۲م‏ وحده. ومع 
ارتفاع النسبة المئوية لكبار السن في الولايات المتحدة؛ فمن المتوقع أن تتزايد حوادث السقوط 
والتكاليف المرتبطة بها. ووفقاً لمراكز التحكم في الأمراض والوقاية منها (0100)؛ فإنَّ «حوادث 
السقوط هي مشكلةٌ صحيةٌ عامة يمكن منعها إلى حَدَّ Pags‏ 

gilî Humana idis‏ أكبر مورد Medicare Advantage eJ‏ الذي dea‏ حوالي ۳۲ ملیون 
عضوء معظمهم من كبار السن. إِنَّ الحفاظ على أعضائها البارزين ومساعدتهم في العيش بأمان 
في منازلهم؛ هو هدفٌ تجاري رئيس؛ إذ يُعَذُ منعٌ حوادث السقوط مكسباً مهماً. ومع ذلك؛ لم 
تكن هناك منهجيةٌ صارمة لتحديد الأفراد الأكثر عرضةً للسقوط والذين تُعَدُ جهود الوقاية مفيدةٌ 
لهم. وعلى عكس الحالات الطبية المزمنة مثل السكري والسرطان؛ فإنَّ السقوط ليس حالةٌ طبيةٌ 
واضحة المعام. وبالإضافة إلى ذلك؛ لا يتم الإبلاغ عن حالات الس قوط عادةً في بيانات المطالبات؛ 
نظراً لأن الأطباء يميلون في الغالب إلى ترميز نتائج السقوطء مثل: الكسور والاضطرابات. وعلى 
الرغم من وجود العديدٍ من التقييمات التي تتم إدارتها إكلينيكيًا لتحديد وجود اللتعثرين؛ فإنها لا 
تصل إلا لعدد محدود من الحالات وتفتقر إلى طاقة فعلية كافية. وعلى هذا النحو؛ فهناك حاجة 
إلى طريقة مس تقبلية دقيقة لتحديد الأفراد الأكثر غُرضةً لخطر السقوط؛ حتى يتمكنوا من اتخاذ 
إجراءات استباقية لمنع السقوط. وقد أجرى التحليل الإحصائ لشركة 1115288 عملية تطوير 
نموذج تنبؤي بحوادث السقوط. وهذا هو أول تقرير رسمي شامل يستفيدٌ من المطالبات الطبية 
والصيدلية الإدارية» والبيانات الإكلينيكية, والأنماط الإكلينيكية المؤقتة» ومعلومات المستهلك» 
وغيرها من البيانات لتعريف الأفراد المعرّضين لخطر السقوط في نطاق زمني مُحدَّد. 

à sj‏ طريقة بي أم فالز (115ه:1 /02) حالياً عنصراً أساسياً لقدرة شركة هيومانا (هههدهدة1) على 
تحديد كبار السن الذين بإمكانهم الاستفادة من التدخلات للتخفيف من سقوطهم. تحديد كبار 
السّن الذين يمكنهم الاستفادة من تدخلات التخفيف من السقوط. وقد أظهر برهان مبدأيّ للمفهوم 
مع مستهلكي ozil Humana‏ هثلون ال ۲ الأعلى ضمن مخاطر السقوط؛ أنَّ عددّ المستفيدين من 
خدمات العلاج الطبيعي قد ارتفعء مشياً إلى أنّ المستهلكين يتخذون خطواتٍ فعالةٌ لتقليل مخاطر 
السقوط. وهناك مبادرةٌ ثانيةٌ تستخدم طريقة oaa PM Falls‏ الأفراد المعرّضين للخطر حتى 
يخضعوا لبرامج اللراقبة عن بُعد. وباس تخدام 2734 تمكّنت 111112238 من تحديد ٠١,٠٠١‏ مستهلك 
تعرّضوا لخطر السقوطء وهم الذين استفادوا من هذا البرنامج. ويرتدي المستهلكون الذين تم 
تحديدهم جهازاً يكتشف السقوط وينبّه المستهلك طُوال اليوم وعلى مدار الأسبوع للمساعدة الفورية. 
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وحصل هذا العمل على JS Lå ¿a Analytics Leadership öjl>‏ تإلاء؟] لإدارة الأعمال 
بجامعة 58ة1ةه1 في عام 710 وذلك لتبئّيه أساليب التحليل في بيئة العمل. 


مثال؟: هدف هيومانا الجريء - تطبيق التحليلات لتحديد المقاييس المناسبة: 


في عام ١٠١۲م؛‏ أعلنت شركة 112204 عن هدف المنظمة الجريء لتحسين صحة المجتمعات 
امحلية بنسبة ×۲١‏ بحلول عام ١٠٠۲م‏ من خلال تسهيل الأمر لتحقيق أقصى درجات الصحة. وهكن 
تعريف المجتمعات التي تخدمها 111١١‏ بطرق عديدة. جغرافياً ll)‏ ا مدينةء الحي)» وحسب 
Medicare Advantage gaby) gil‏ الخطط القانة على صاحب العمل الخدمات المشتراة JS‏ 
فردي)» أو عن طريق الملف الإكلينيي (شروط الأولوية بما في ذلك مرض السكريء ارتفاع ضغط الدم, 
CHF‏ [فشل القلب الاحتقاني]ء 047 [مرض الشريان التاجي]ء 0071 (مرض الانسداد الرئوي 
المزمن) أو ”الاكتئاب". إِنَّ فهم صحة هذه المجتمعات وكيفية تتبّعها بمرور الوقت؛ أمرٌ بالغ الأهمية 
ليس فقط لتقييم الهدف؛ ولكن أيضاً في صياغة إستراتيجيات لتحسين الصحة العضوية في مجملها. 
وكان التحَدّي أمام منظمة التحليلات يتمثل في تحديد مقياس يُبرز جوهر الهدف الجريء؛ لأن 
مقاييس التأمين الصحي التقليدية المقاسة موضوعيًاء مثل القبول في المستشفيات أو زيارات غرف 
الطوارئ لكل ٠٠٠١‏ شخص لن تنهض هذه المهمة الجديدة. وكان الهدف ado sa‏ المقياس 
الذي يحافظ عليها ويُحسّنها في المجتمع؛ ولكن يجب أن يكون مرتبطاً بأعمال شركة هيومانا 
Humana col à ajLo Alles cole 35 JM 9 «9 (Humana)‏ في نهاية المطاف ”الأيام 
الصحية“؛ وهو عبارة عن استبيان من أربعة أسئلةء عن جودة الحياة 485 تمّ تطويره من قبل 
مركز التحكم في الأمراض لتتبع وقياس تقدُّمهم نحو تحقيق الهدف الجريء. 
كان من الضروري التأكّد من أن المقياس المُحدّد يرتبط ارتباطاً كبيراً مقاييس الصحة والأعمال؛ 
بحيث يؤدي (el‏ تحسّن في الأيام الصحية إلى تحسين الصحة» وإلى نتائج أعمال أفضلء وتتضمّن 
الأمثلة التالية كيفية ارتباط ”الأيام الصحية“ بمقاييس الاهتمام: 
- يظهر الأفراد الذين لديهم أيام غير صحية أكثر استخداماً وأنماط تكلفة عالية. لكل 0 أيام غير 
صحية إضافية هناك: 
١ (‏ ) زيادة قدرها ۸۲ دولاراً في متوسط التكاليف الطبية والصيدلية الشهرية. 
(ب) زیادة قدرها ٥۲‏ دخولاً للمستشفيات لكلّ ٠٠٠١‏ مريض. 
(ج) زيادة ٠,۲۸‏ يوماً في متوسط مدة البقاء. 
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- الأفراد الذين يُظهرون س لوكيات سليمة وظروفهم المزمنة تدار بشكل جيد لديهم عدد أيام غير صحية 
Ji‏ على سبيل المثال: الأفراد المصابون بمرض السكري لديهم Sae‏ أيام غير صحية أقل إذا حصلوا على 
فحص الدهون السيئة أو فحص العين السُكرية وبالمثل» إذا كان هناك تحكم في مستويات السكر في الدم. 
- الأفراد الذين يعانون من الأمراض المزمنة لديهم عدد أيام غير صحية أكثر ممَّن ليس لديهم 
حالات مزمنة ومنها: مرض السكريء ارتفاع ضغط الدم. :0117© [فشل القلب الاحتقاني]» CAD‏ 
[مرض الشريان التاجي]ء COPD‏ (مرض الانسداد الرئوي المزمن) ”أو الاكتئاب“. 
ومنذ ذلك الحينء اعتمدت 1٠2١3‏ الأيام الصحية كمقياس لها لقياس التقذّم نحو تحقيق 
هدفها الجريء. 
مثالا: نماذج تنبؤية لتحديد أعلى نسبة من المخاطر في شركة تأمين صحي: 
تنطبق قاعدة ۸٠/۲١‏ بشكل عام على الرعاية الصحيةء وتعني أن حوالي >۲١‏ من ا مرضى 
يستهلكون ۸٠0‏ من موارد الرعاية الصحية؛ بسبب حالتهم الصحية المتدهورة أو المزمنة. 
إِنَّ تحديد الأعضاء المناسبين أمرٌ حاسم في التسجيل في الرعاية الصحيةء وفي السنوات الأخيرة تم 
تطويرٌ أنظمة لإدارة الأداء تقوم بتحديد المُسجُلِين الأعلى مخاطر في المستقبل. كما تمّ تطويرُ العديد 
من أنظمة إدارة الأداء هذه مع الاعتماد الكبير على بيانات المطالبات الطبية والتي تنتج عن الخدمات 
الطبية التي يستخدمها المسجلون. بسبب التأخر الموجود في تقديم بيانات المطالبات ومعالجتهاء 
هناك تأخر مماثل في تحديد الأعضاء المعرضين لمخاطر عالية للتسجيل في البرامج السريرية» وهذه 
المسألة ذات أهمية خاصةً عندما ينضمٌ أعضاء جُدُد إلى شركة تأمين صحي كون ليس لديهم تاريخ 
مطالبات صحي مع شركات تأمين أخرى. يمكن أن يستغرق مُقدَّم الطلب الذي يعتمدُ على المطالبات 
في المتوسط 17-4 شهراً بعد تسجيل أعضاء جُدُّد لتحديدهم للإحالة إلى البرامج الإكلينيكية. 
في أوائل العقد الجاري جذبت شركة هيومانا العديد من الأعضاء SX AUI‏ من خلال منتجات 
Jilg (Medicare Advantage) galbo] Stao‏ احتاجت إلى طرق أفضل لإدارة الأعضاء. وعلى 
هذا النحو؛ أصبح من المهمٌ للغاية تطوير نهج تحليلي آخر لتحديد الأعضاء الجدد ذوي المخاطر 
العالية بشكلٍ سريع ودقيق للإدارة الإكلينيكية» للحفاظ على صحة هذه المجموعة وخفض التكاليف. 
وقد قام فريق التحليلات الإكلينيكية التابع ل 11822 بتطوير نموذج التنبؤ بالأعضاء 
الجدد (2181231) والذي سيُحدّد بسرعة الأفراد المعرّضين للخطرء وسيغيّر قريباً تسجيلهم الجديد 
للبرنامج مع «Humana‏ بدلاً من الانتظار حتى يصبح تاريخ المطالبة الكافي متاحاً لتجميع الملفات 
الإكلينيكية والتنبؤ بمخاطر الصحة المستقبلية. وقد تمّ تصميمٌ نموذج التنبؤ بالأعضاء الجُدُد 
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لمواجهة التَحَدِّيات الفريدة المرتبطة بالأعضاء الجُدُده وهو أسلوبٌ حديدٌ استفاد من مجموعات 
البيانات الأوسع نطاقاً ودمجها بخلاف بيانات المطالبات الطبية» مثل بيانات تقييم المخاطر الصحية 
التي تم الإبلاغ عنها ذاتياً والمؤشرات المبكرة من بيانات الصيدلةء واستخدام أساليب التنقيب في 
البيانات المتقدّمة لاكتشاف النمطء وسجل المستهلك يوميًا في f3Uz,, Medicare Advantage‏ 
إلى أحدث بيانات 11110208 حتى الآن. وقد تمّ نشرٌ النموذج من خلال فريق مُتعدّد الوظائف 
من التحليلات وتقنية المعلومات والعمليات؛ لضمان تكامل التشغيل وتكامل الأعمال بسلاسة. 

ومنذ أن تمّ تطبيقٌ نموذج التنبؤ بالأعضاء الجدد في ینایر ۲۰۱۳؛ فقد استطاعوا بشکل سریع تحدید 
الأعضاء ذوي المخاطر العالية من أجل تسجيلهم في برامج تعليمية إكلينيكية. وقد تمّ إبراز النتائج 
الإيجابية التي تحققت من خلال هذا النموذج في العديد من اتصالات القيادات العليا من 808دصد11. 
وفي الربع الأول من عام 01 أعلن Bruce Broussard‏ الرئيس التنفيذي لشركة 2822مد11. عن 
”الزيادة التي طرأت على الأعضاء الجدد والتحسن في عمليات التقيي م الإكلينيكي“» والتي أذَّت إلى 
تسجيل ٠٠٠١‏ عضو جديد في البرامج الإكلينيكية: مقارنةٌ ب 60٠١‏ عضو في نفس البرنامج عن فترة 
سابقة من العام» بزيادة قدرها 1۷0<. بالإضافة إلى زيادة حجم التس جيل في البرنامج الإكلينيكي؛ 
أظهرت دراسات النتائج أن المستهلكين الجُدُّد المسجّلين الذين حَذَّدهم نموذج التنبؤ بالأعضاء الجدد 
قد تمّ تحويلهم إلى البرامج الإكلينيكية في وقتٍ أقربء مع أكثر من 0٠‏ من الحالات المحؤّلة التي تم 
تحديدها خلال الأشهر الثلاثة الأولى بعد التسجيل الجديد في 35g Medicare Advantage‏ شارك 
المستهلكون الذين تمّ تحديدهم أيضاً بمعدل أعلى واستمروا لفترة أطول في البرامج. 

توضّح هذه الأمثلة كيفية قيام المنظمة باستكشاف تطبيقات التحليل وتطبيقها لتحقيق أهدافها الإستراتيجية. 
وسنعرض في الفصول القادمة من هذا الكتاب العديد من الأمثلة الأخرى لتطبيقات الرعاية الصحية. 
تحليلات سلسلة قيمة البيع بالتجزئة: 

يُعَذّ قطاع البيع بالتجزئة؛ هو ا مكان الذي قد ترى فيه معظم تطبيقات التحليلات» وهو مجالٌ 
تكون فيه القيم كبيرةٌ ولكن هوامش الربح عادةً تكون ضئيلةً وفيه تتغير أذواق العملاء وتفضيلاتهم 
بشكلٍ متكرّر؛ مما يجعل المتاجر - المباشرة أو عبر الإنترنت - تواجه العديدّ من التحَذَّيات في سبيل 
النجاح. وهيمنة السوق في وقتٍ واحدٍ لا تضمن نجاحًا مستمرً؛ لذا فإنَّ الاستثمار في تعلّم الكثير 
عن المورّدين والعملاء والموظفين وكلّ المساهمين الذين يدفعون سلس لة قيمة بيع التجزئة إلى 
النجاح واستخدام تلك ا معلومات لاتخاذ قراراتِ أفضل كان هدفاً لصناعة التحليلات لفترة طويلة. 
وحتى قراء التحليلات العارضين يعرفون استثمارات 4223208 الهائلة في التحليلات لتقوية سلسلة 
القيمة التابعة لهم. وبامثل؛ استثمرت كل من los Targets Walmart‏ من كبار تجار التجزئة 
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ملايين الدولارات في التحليلات الخاصة بسلاسل التوريد الخاصة بهم. ويتمتع معظم مورّدي 
تقنية وخدمة السو ع ا عي ل o‏ 
التطبيقات لتحقيق هدف التعرّض الذي نحن بصدد دراسته يمكن أن تملأ كتابًا كامًا. لذلك يُسلّط 
هذا القسم الضوء فقط على بعض التطبيقات المحتملة. وقد تمّ إجراءٌ معظم هذه العمليات 
بواسطة العديد من تجار التجزئة ويتمٌ توفيرها من خلال العديد من مُورّدي التقنية؛ ولذلك 
ففي هذا القسم سوف نلقي نظرةً أكثر عموميةً بدلا من الإشارة إلى حالات مُحدّدة. وتم اقترا 
هذه النظرة العامة من قبل نطاه۸ علعطونططة المدير التنفيذي ل VCreaTek.com‏ 5( شركة 
لخدمات البرمجيات التحليلية ولديها مكاتبُ في الهند والولايات المتحدة والإمارات العربية المتحدة 
وبلجيكا؛ إذ ثم تقوم الشركة بتطوير تطبيقات في مجالات متعددة. وخصوصًا تحليلات بيع التجزئة. 

ويعرض الشكل )1١-١(‏ المكونات المختارة لسلسلة قيمة بيع التجزئة. يبدأ الشكل بالمورّدين 
ويختتم بالعملاء؛ ولكنه يوضح العديدٌ من نقاط قرار التخطيط الإستراتيجي والتشغيلي المتوسط؛ 
إذ يمكن أن تلعبَ التحليلات - الوصفية أو التنبؤية أو التوجيهية - دورًا في اتخاذ قراراتِ أفضل 
تعتمد على البيانات. كما يوضح الجدول )١-١(‏ أيضاً بعض اللجالات المهمة لتطبيقات التحليلات» 
وأمثلة على الأسئلة الرئيسة التي يمكن أن تجيب عنها التحليلات. وبكلٌ تأكيد. قيمة الأعمال 
ا محتملة المشتقة من إجراء مثل هذه التحليلات. ثم يتم مناقشة بعض الأمثلة فيما بعد. 





سلسلة قيمة بيع التجزئة 
الإحتياجات الحرجة فى كل نقطة إتصال على سلسلة قيمة بيع التجزنة 





اللمبيعات 
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شكل ١-؟1:‏ مثال لتطبيقات التحليلات في سلسلة قيمة بيع التجزئة 
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p‏ سؤال الأعمال قيمة الأعمال 
- أي المنتجات عليها طلبٌ أعلى؟ -١‏ توقع استهلاك المنتجات سريعة الحركة, 
-Y‏ ما هي المنتجات بطيئة الحركة| وطلب مخزون كاف منها لتجنْب 
تحسين أو المتقادمة؟ سيناريو نفاذ pe‏ 
المخزون obs» JÀ xs g à -Y‏ المخزون للمنتجات 
بطيئة الحركة؛ من خلال الجمع بينها في 
طلب مرتفع. 
-١‏ ما مقدار صافي هامش الربح؟ -١‏ تخفيض السعر لكل منتج يمكن أن يقلل 
مرونة -١|‏ ما مقدار الخصم الممكن منحه على | خسارة هامش الدولار. 
السعر | النتج؟ ez -Y‏ تحديدُ السعر الأمثل لحزمة المنتجات 
لتوفير هامش الدولار 
-١‏ ماهي المنتجات التي يجب دمجها | -١‏ يُحدَّد تحليلُ التقارب الارتباطات الخفية 
لإنشاء عرض حزمة؟ بين المنتجاتء والتي يمكن أن تساعد في 
-Y‏ هل يجبُ الجمع بين المنتجات بناءً | القيم التالية: 
js‏ على خصائص الحركة البطيئة والسريعة | ٠‏ وضع إستاتيجية لحزمة انتج 
zh.‏ الحركة؟ ١‏ إستنادًا إلى التركيز على المخزون أو 
. |"- هل يجب إنشاء حزمة من نفس الفئة أو الهامش. 
ees‏ خط فئة مختلف؟ ٠‏ زيادة عمليات 1له©5-5ومت عن 
طريق إنشاء حزمة من فئات 
مختلفة أو زيادة عمليات up-sell‏ 
من نفس الفئات. 
T‏ مَنْ من العملاء يشتري أيّ المنتجات في أي | عن طريق تقسيم العملاء؛ يمكن مالك 
> أمكان؟ eS iai uos) e LA] diss‏ 0 
pee‏ تجربة العملاءء وتؤدي إلى الاحتفاظ بهم. 
vé‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


نظرة عامة على ذكاء الأعمال والتحليلات وعلم البيانات 














A‏ سؤال الأعمال قيمة الأعمال 
-١‏ مَنْ هم العملاء الذين لن يعودوا؟ -١‏ يمكن تحديدٌُ العلاقات بين العملاء 
لا- ما مقدار الخسارة في الأعمال؟ والمنتجات التي تؤدي لتحؤل العملاء. 
تحليل |۳- كيف هكن الاحتفاظ بهم؟ وبالتالي يمكن أن يتم التركيز بشكل 
Jas‏ إ٤-‏ ما التركيبة السكانية للعميل صاحب أفضل على جودة المنتج والسبب وراء 
العميل إلى أ الولاء؟ هذا التحول. 
امنافسين ۲- بالاعت ماد على قيمة حياة العميل 
saboh Bzyb ELEI Se (LTV)‏ 
مما يؤدي إلى الاحتفاظ بالعميل. 
-١‏ ما هي قناة اكتساب العملاء ذات | يمكن تحسينُ ميزانية التسويق بناءً على 
تحليل التكلفة الأقل؟ رؤية العائد الأفضل على الاستثمار. 
القنوات | ۲- ما هي قناة الاحتفاظ الأفضل بالعملاء؟ 
-Y‏ ما هي القناة الأكثر ربحية؟ 
-١‏ ما هو الموقع الواجب اختياره؟ -١‏ يمكن استخدامٌ أفضل الممارسات للمواقع 
تحليل |- ما هو المخزون الافتتاحي الواجب اقتناؤه ١‏ والقنوات الأخرى للبدء في القفز. 
الفروع وما مقداره؟ -٠‏ يمكن أن تساعدّ المقارنة ببيانات المنافس 
الجديدة في إنشاء عامل تمييز/ 1757 لجذب 
العملاء الجدد. 
-١‏ كيف يجب تخطيط المتجر؛ من أجل | -١‏ فهم ارتباط المنتجات لاتخاذ قرارٍ يشأن 
الخطوط العليا الأفضل؟ تصميم المتجر وتوافقه بشكل أفضل مع 
تصميم |- كيف يمكنُ زيادة تجربة العملاء داخل | احتياجات العملاء. 
المتجر المتجر؟ - يمكن تخطيطٌ نشر القوى العاملة لتفاعل 


العملاء بشكلٍ أفضل وبالتالي إرضاء 
تجربة العملاء. 
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سؤال الأعمال قيمة الأعمال 
التحليل 





-١‏ ما التركيبة الشُكانية التي تدخل المتجر | -١‏ يمكن تخطيطٌ العروض الترويجية 
خلال فترة ذروة المبيعات؟ والأحداث داخل المتجر بناءً على التركيبة 

تحليلات | ۲- كيف همكن تحديد العميل صاحب | السكانية للزيارات الواردة. 

الفيديو | أعلى (11۷) عند مدخل المتجر؛ بحيث | لا- مشاركة العميل المُستَهدّف والخصم 

يمكن توفير تجربة شخصية أفضل لهذا الفوري يُعزّزَان تجربة العميل؛ مما يؤدي 

العميل؟ إلى زيادة الاحتفاظ به. 

















عادةً ما يعرف موقع بيع التجزئة عبر الإنترنت عملاءه بمجرد تسجيل دخول العميلء وبالتالي 
يمكنهم تقديم صفحات/ عروض مُخصّصة لتحسين التجربة. وبالنسبة o‏ متجر gd‏ التجزئة؛ 
فَإنَّ معرفة عميله عند مدخل المتجر لا Jig Jlj‏ تحديّا كبيرًا. ومن خلال الجمع بين تحليلات 
الفيديو والمعلومات/ الشَّارات الصادرة من خلال برنامج الولاء. قد يتمكّن المتجرٌ من تحديد 
العميل عند المدخل نفسه. وبالتالي تمكين فرصة إضافية لعمليات [اء5-وومت أو up-sell‏ وعلاوةٌ 
على ذلك؛ يمكن توفير تجربة تسوق شخصية بمشاركة أكثر تخصيصاً خلال وقت العميل في المتجر. 

ويستثمر تجارٌ التجزئة الكثير من امال في نوافذ عرض جذدَّابة أو فعاليات ترويجية أو 
رسومات مُخصّصة أو تزيين المتجر أو إعلانات مطبوعة أو لافتات. ولتعزيز فعالية هذه الأساليب 
التسويقية؛ يمكن للفريق استخدامٌ تحليلات المتسوقين من خلال مراقبة صور الدوائر التلفزيونية 
المغلقة (CCTV)‏ لعرفة التفاصيل الدهوغرافية لحركة القدم داخل المتجر ويمكن تحليلٌ صور 
017 باستخدام خوارزميات مُتقدّمة لاستخراج تفاصيل دهموغرافية» مثل: السّن والجنس» 
ومزاج الشخص الذي يتجول بالمتجر. 

إضافةً إلى ذلك؟ يكن لبيانات حركة العميل داخل المنجر عند دمجها مع تصميم الرفوف أن تعطي 
نظرةً ثاقبةٌ مدير المتجر لتحديد مناطق البيع السَّاخنة/ المربحة داخل المتجر. وعلاوةً على ذلك؛ يمكن 
مدير المتجر استخدامٌ هذه المعلومات لتخطيط توزيع القوة العاملة لهذه المناطق في أثناء فترات الذروة. 

Sales‏ ما يتم استخدامٌ تحليل سلة السوق من قبل مديري الأقسام لدفع بيع 516175 بطيئة 
الحركة. وباستخدام التحليلات المتقدّمة من البيانات المتاحة؛ يمكن أن يكون تقاربٌ المنتج في 
أدفى مستوى من 51617 لدفع عائدات الاستثمار على عروض الحزمة لأعلى. وبالإضافة إلى ذلك؛ 
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فباستخدام أساليب مرونة السعر؛ هكن أيضاً تخفيض السعر لعرض الباقة؛ مما يقلل أيّ خسارة 
في هامش الربح. 

وهكذاء وباستخدام بيانات التحليلات» لا هكن لتجار التجزثة الحصول على معلومات عن 
عملياتهم الحالية فحسب؛ بل يمكن أيضاً الحصولٌ على مزيد من الإحصاءات لزيادة الإيرادات 
وخفض التكلفة التشغيلية لربح أعلى. ويقترح مدوّن في علوم البيانات المركزية Data Science)‏ 
(Central‏ $46 شاملةً إلى حَذَّ ما لتطبيقات تحليلات التجزئة الحالية وا محتملة والتي كن ملتاجر 
التجزئة الكيرى مثل 408202 استخدامها. وهذه القائمة متاحةٌ على: 
http://www.datasciencecentral.com/profiles/blogs/20-data-science-systems-used-by-‏ 

ainazon-to-operate-its-business. 


OB Dilao 6,53 Ss‏ هناك العديدَ من الأمثلة على هذه الفرص امُدرّجة هنا؛ ولكنك سترى 
العديد من الأمثلة على مثل هذه التطبيقات في جميع أنحاء الكتاب. 


أسئلة مراجعة على القسم :5-١‏ 

-١‏ لماذا تستثمرٌ شركة التأمين الصحي في التحليلات عقب اكتشاف الاحتيال؟ ولماذا من مصلحتهم 
التنبؤ باحتمالية سقوط المرضى؟ 

؟- ما هي التطبيقات الأخرى المشابهة للتنبؤ بالسقوط التي يمكنك تصورها؟ 

- كيف تقنع عميل تأمين صحي جديداً بتبَنّي أماط S(Humana ” Jès) iao ŝlos‏ 

4- خَدَّد على الأقل ثلاث فرصٍ أخرى لتطبيق التحليلات في سلسلة قيمة البيع بالتجزئة بخلاف 
تلك التي تمَّ تغطيتها في هذا القسم. 

5- ماهي متاجرٌ بيع التجزئة التي تعرفها التي تستخدمٌ بعض تطبيقات التحليلات» التي 
تمّ تحديدّها في هذا القسم؟ 

۷-1 مقدمة موجزة لتحليلات البيانات الضخمة: 


ما هي البياناث الضخمة؟ 
il‏ كتاب عن التحليلات وعلم البيانات؛ يجبُ أن يشمل تغطيةً كبيرةَ لما يُسمّى بتحليلات 
البيانات الضخمة. وسنقوم بتغطيتها في الفصل السابع؛ ولكننا هنا نعرض مقدمةٌ موجزةً للغاية 
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عن بداية ظهورها. إِنَّ عقولنا تعمل بسرعة وفعالية عالية ومتنوعة في معالجة كمياتٍ كبيرة من 
جميع أنواع البيانات: الصورء والنصوص, والأصواتء والروائح» ومقاطع الفيديو. حيث تقوم 
بمعالجة جميع أشكل البيانات المختلفة بسهولة نسبية. غير أنَّ أجهزة الحاسوب لا Jes Jl‏ 
صعوبة في مواكبة وتيرة إنشاء البيانات» فضلاً عن تحليلها بسرعةء وهذا هو السبب في أن لدينا 
مشكلة البيانات الضخمة. إذلّ ما البياناثٌ الضخمة؟ ببساطة البيانات الضخمة؛ هي البيانات التي 
لا يمكن تخزينها في وحدة تخزين واحدة. وتشير البياناث الضخمة عادةً إلى البيانات à db GUI‏ 
العديد من الأشكال المختلفة: مهيكلةٌ وغير مهيكلة. في تيارء وما إلى ذلك. إن المصادر الرئيسة 
مثل هذه البيانات هي مقتطفات من مواقع الويبء والمنشورات بمواقع التواصل الاجتماعي مثل 
Facebook‏ وبيانات من الزيارات أو من أجهزة الاستشعار أو الطقس. ويحتاج أي محرك بحث 
على Google Lo eugh‏ إلى بحث وفهرسة المليارات من صفحات الويب لمنحك نتائج بحث 
ملائمة في جزءِ من الثانية. وعلى الرغم من أن هذا لا يتم بشكلٍ لحظي؛ فَإنَّ إنشاء فهرس لجميع 
صفحات الويب على الإنترنت ليس مهمة سهلة. ولحُسْن الحظ؛ فقد تمكّتت شركة go Google‏ 
حل هذه المشكلة. فمن بين الأدوات الأخرىء استخدمت أساليب تحليل البيانات الضخمة. 

وهناك جانبان لإدارة البيانات بهذا الحجم وهما: التخزين والمعالجة. فإذا استطعنا شراء 
i>‏ تخزين VE‏ للغاية لتخزين كلّ هذا في مکانِ واحد على وحدة واحدة؛ óp‏ جعل هذه 
الوحدة تسمح بالخطأ قد يكون مكلفاً للغاية. ومن ثم فقد تمّ £58 de jais gis Jor‏ 
تخزين هذه البيانات في أجزاء مختلفة من أجهزة متصلة بشبكة: ووضع نسخة أو اثنتين من 
هذه البيانات في مواقع مختلفة على الشبكة: من الناحيتين المنطقية والمادية. وتمّ استخدامه في 
(Google clàla ella; ISI (2,3 01S (s:ls) Google à J.eMI‏ $35 تطويره وإصداره لاحقاً 
(Hadoop HDFS) (ja &s.ALI colàlll elà5 e ib Apache g 5 s‏ 

ومع ذلك؟ فإن تخزين هذه البيانات بمثل نصف المشكلة فقط. فالبيانات لا قيمة لها إذا كانت 
Éad páis Y‏ للأعمال ولكي توفر قيمةً للأعمال؛ فلا بد من تحليلها. ولكن كيف يمكن تحليلٌ 
هذا القدر الهائل من البيانات؟ حيث لا يمكن تمريرٌ كافة الحسابات إلى جهاز حاسوب واحد. 
فهذا من شأنه إنشاءٌ قدرٍ من أحمال البيانات على هذا الجهاز. وقد تمٌ اقترا حل عبقري آخر. 
وهو دفع الحوسبة إلى البيانات» بدلاً من دفع البيانات إلى عقدة الحوسبة. وقد كان هذا نموذجًا 
جديدًا وأسفر عن طريقة جديدة تمامًا لمعالجة البيانات» وهذا ما نعرفه اليوم باسم نموذج برمجة 
.MapReduce‏ الذي جعل معالجة البيانات الضخمة حقيقة. وقد تم تطويرٌُ à MapReduce‏ 
الأصل في ©1ع600. وظهر إصدارٌ لاحق من قبل مشروع .Hadoop MapReduce Jaw Apache‏ 
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HDES عندما نتحدثُ عن التخزين أو المعالجة أو تحليل البيانات الضخمة؛ فإننا نذكر‎ o ls 
مستوی معين» وقد تم اقتراحُ معايير وبرامج أخرى ذات صلة. وعلى الرغم من‎ xi. MapReduces 
أن مجموعة الأدوات الرئيسة متاحة بالمجان؛ فقد تمّ إطلاق العديد من الشركات لتقديم التدريب‎ 
-Teradata Asters Clouderag HortonWorks Ja .Jisxll Mus (à أو الخدمات المتخصصة‎ 

وعلى مدى السنوات القليلة الماضية حدث مزيدٌ من التغير؛ فما كان يُسمَّى البيانات الضخمة 
أصبح الآن تطبيقات البيانات الضخمة. وقد أضافت الحاجةٌ إلى معالجة البيانات القادمة سرعةٌ 
إلى المعادلة. ومن الأمثلة على معالجة البيانات السريعة؛ التداول الخوارزمي. والذي يستخدم 
المنصات الإلكترونية القائمة على خوارزميات تداول الأسهم في السوق المالية» والتي تعمل في 
غضون الميكروثانية. ومن الأمثلة الأخرى على المجموعة الواسعة من البيانات؛ هو تحليل coe Ud‏ 
والذي يستخدم أشكلاً مختلفةً من البيانات من منصات وسائل التواصل الاجتماعي واستجابات 
العملاء لقياس المشاعر. واليوء ترتبط البيانات الضخمة باي نوع من البيانات الكبيرة التي 
تتميرُ بخصائص الحجم والسرعة والتنوع. وتوضّح الحالة العملية 1-١‏ تطبيق تحليلات البيانات 
الضخمة في صناعة الطاقة. وسوف ندرس تقنيات وتطبيقات البيانات الضخمة في الفصل السابع. 


أستلة مراجعة على القسم :۷-١‏ 

-١‏ ما هي تحليلاتٌ البيانات الضخمة؟ 

؟- ما هي مصادرٌ البيانات الضخمة؟ 

*- ما هي خصائصٌ البيانات الضخمة؟ 

-٤‏ ما هي المعالجةٌ الفنية التي يتم تطبيقها لممعالجة البيانات الضخمة؟ 


(1) http//www.cdc.gov/homeandrecreationalsafety/falls/adultfalls.html. 

Q2) Gill, T. M., Murphy, T. E., Gahbauer, E. A., et al. (2013). Association of injurious falls with disability. 
outcomes and nursing home admissions in community living older persons. American Journal of. 
Epidemiology, 178(3), 418-425. 

(3) Gates, S., Smith, L. A., Fisher, J. D., et al. (2008). Systematic review of accuracy of screening instruments 
for predicting fall risk among independently living older adults. Journal of Rehabilitation Research 
and Development, 45(8), 1105-1116. 


Contributors: Harpreet Singh, PhD; Vipin Gopal, PhD; Philip Painter, MD. 
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حالة عملية 5-1١‏ 

شركة dla! Center Point‏ تستخدم التحليلات الفورية للبيانات الضخمة؛ لتحسين خدمة العملاء 

sao] BUU Center Point Sà is‏ الشركات الكبرى لتوصيل الطاقة ويقع مقرّها في 
هيوستون» تكساس. وتشمل أعمالها الأساسية نقل وتوزيع الكهرباءء وتوزيع الغاز الطبيعي» 
ومبيعات وخدمات الغاز الطبيعي. ولديها أكثرُ من خمسة ملايين عميل في الولايات امتحدة. 

وتستخدم الشركة شبكات الطاقة الذكية؛ لجمع المعلومات الفورية عن صحة 
الجوانب المختلفة للش بكة. مثل: العدادات والمحولات والمفاتيح اللمستخدّمة في توفير 
الكهرباء. oia dlos gwg‏ المعلومات بشكلٍ فوري باستخدام الطاقة مع تحليلات 
البيانات الضخمة؛ مما يتيحٌ تشخيصًا دقيقًا وأسرع بكثير. فعلى سبيل المثال: يمكن أن 
تتنبأ وتساعد في منع انقطاع التيار الكهربائي. 

إضافةً إلى ذلك؛ تقوم الشركة بجمع بيانات الطقس؛ مما يسمح بأن تساعد البيانات 
التاريخية في التنبؤ بانقطاع التيار نتيجةً للعاصفة. وتعمل هذه الرؤية كدليل إرشادي 
لوضع الموارد الصحيحة قبل العاصفة؛ لتجنب حدوث الانقطاع. 

ثانيةً ومن أجل أن تفهم عملاءها على نحو أفضل, تستخدم 26:زه5 06161 تحليل 
المشاعر الذي يفحص رأي العميل عن طريق العاطفة (السعادة والغضب والحزنء وما 
إلى ذلك) وتقوم الشركة بتصنيف عملائها Fy‏ على مشاعرهم ومن ثم تكون قادرةً على 
البيع لعملائها بطريقة تستند إلى شخصياتهم وتقدم تجارب أكثر قيمة للعملاء. 

ونتيجةٌ لاامتخدام تحليلات البيانات الضخمة: ورت الشركة 7٠0,٠٠٠‏ جالون من 
الوقود في العامين الماضيين؛ من خلال حلّ ستة ملايين طلب خدمة عن بُعْد. بالإضافة 
إلى ذلكء وفّْرت الشركة VE‏ مليون دولار لعملائها في هذه العملية. 

أسئلة للمناقشة: 

-١‏ كيف ُمكن لشركات الكهرباء التنبؤ بانقطاع ممكن في موقع؟ 

-٠‏ ما هو تحليلٌ مشاعر العميل؟ 

'- كيف يساعدٌ تحليلٌ مشاعر العملاء الشركات على تقديم خدمة مُخصّصة لعملائها؟ 
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ما الذي هكننا تعلمه من هذه الحالة العملية: 
à‏ 

باستخدام تحليلات البيانات الضخمة؛ يمكن تشركات الطاقة حَل مشكلات العملاء بشكل 
أفضل مثل انقطاع التيار والأعطال الكهربائية في غضون فترة زمنية أقصر مقارنةٌ بالعمليات 
السابقة. كما يمكن أن يساعد تحليلٌ ال مشاعر في استهداف عملائهم وفقاً لاحتياجاتهم. 
Sources: Sap.com, "A 'Smart' Approach to Big Data in the Energy Industry; http://www.‏ 
sap.com/bin/sapcom/cs cz/downloadasset.201310--oct-0920-.a-smart-approach-to-‏ 
big-data-in-the-energyindustry-pdfhtml (accessed June 2016); centerpointenergy.‏ 
com, "Electric Transmission & Distribution (T&D);" http//www.centerpointenergy.‏ 
com/en-us/Corp/Pages/Company-overview.aspx (accessed June 2016); YouTube.com,‏ 


"CenterPoint Energy Talks Real Time big Data Analytics; https://www.youtube.com/ 
watch?v-s7CzeSIIEfI (accessed June 2016). 


۸-١‏ نظرة عامة على النظام البيئي للتحليلات: 

أنت الآن عزيزي القارئ وبناءً على ما تقدّم؛ مُتحمّسٌ لإمكانات التحليلات وتريد الانضمام 
إلى هذه الصناعة المتنامية. ولكن مَنْ هم اللاعبون الحاليون وماذا يفعلون؟ وما المكان الذي 
يناسبك؟ Sagl Ól‏ من هذا القسم هو تحديدُ قطاعاتٍ مختلفة من صناعة التحليلات» وتقديم 
تصنيف للأنواع ا مختلفة من المشاركين في الصناعةء وتوضيح أنواع الفرص اللتاحة لمحترفي 
التحليلات. لقد تَمّ تحديدُ أحد عشر نوعًا مختلقًا من اللاعبين في النظام البيئي للتحليلات. كما 
أنّ فهم النظام البيئي يعطي القارئ رؤية أوسع لكيفية تلاقي اللاعبين المختلفين. وهناك غرض 
ثانوي لفهم النظام البيئي للتحليلات» الخاص بمتخصّصي ذكاء الأعمال أيضاً وهو أن يكون على 
علم بالشركات والعروض والفرص الجديدة في القطاعات المتحالفة مع التحليلات. ويُختتم القسم 
ببعض الملاحظات عن الفرص المتاحة للمحترفين للتحرّك عبر هذه المجموعات. 

وعلى الرّغم من أن بعض الباحثين قد ميّزوا بين مُتخصّصي تحليل الأعمال وعلماء البيانات 
0:0مهعة2 و2012 »انندط)ء كما أشرنا سابقاً بهدف فهم النظام البيئي الشامل للتحليلات؛ 
فإننا نعاملهم كمهنة واحدة واسعة. ومن الواضح أن احتياجات المهارات قد تختلف بين أخصائي 
رياضيات قوي إلى مبرمج إلى مصمم نماذج إلى أخصاني اتصالات. ونعتقد أنَّ هذه المسألة قد 
تمّ حلّها على مستوى أصغر/ فردي بدلاً من المستوى الكلي لفهم مجموع الفرص. ÅS LS‏ 
تعريقًا واسعًا للتحليلات ليشمل جميع الأنواع الثلاثة وفقاً ل 121101115 وهي الوصفية/ إعداد 
التقارير/ التصويرات» والتنبؤية والتوجيهية كما هو مُوضّح سابقًا. 
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ويُوضّح الشكلٌ W-Y‏ وجهة نظر واحدة للنظام البيني للتحليل. إذ تتمثل مكونات النظام 
البيني في بتلات زهرة التحليلات. وقد تم ass‏ أحد عشر قطاعًا أو قسمًا رئيسا في مجال 
التحليلات. ويتمٌ تجميع مكونات النظام البيئي التحليلي في ثلاث فئات تمثلها البتلات الداخلية, 
والبتلات الخارجية» وبذرة (الجزء الأوسط من) الزهرة. 

ويمكن أن يُطلّق على البتلات الستة الخارجية موردو التقنية. وتأق إيراداتهم من تقديم 
التقنية: والحلولء والتدريب لمنظمات مستخدمي التحليلات؛ حتى يتمكّنوا من توظيف هذه 
التقنيات بأكثر الطرق فعاليةٌ وكفاءةً. ويمكن تعريفٌ البتلة الداخلية بصفة عامة كمسرعات 
التحليلات. وتعمل أجهزةٌ التسريع مع موزدي التقنية والمستخدمين. وأخيرا؛ يشتمل جوهر النظام 
البيني على منظمات مستخدمي التحليلات. وهذا هو العنصر الأكثر أهمية؛ إذ يتم دفع كل 
مجموعة من مجموعات صناعة التحليلات من قبل منظمات المستخدمين. 

















شكل :1-١‏ النظام البيئي للتحليلات 

Ól‏ استعارة اسم «زهرة» مناسبٌ تمامًا للنظام البيئي للتحليلات؛ إذ يتداخل العديدٌ من الأشخاص 
بعضهم مع بعض. على غرار كائن حي مثل الزهرة. حيث تنمو كل هذه البتلات وتذوب معاً. 
ونحن نستخدمٌ مصطلحات المكونات والمجموعات والبتلات والقطاعات بشكلٍ متبادل لوصف 
اللاعبين المختلفين في مجال التحليلات. وسنقدَّم فيما يلي كلاً من القطاعات الصناعية كما سنقدّم 
بعض الأمثلة للاعبين في كلّ قطاع. إن قائمة أسماء الشركات المُدرّجة في أيّ بتلة ليست شاملة. 
فقائمة الممثلين للشركات في كلّ مجموعة تهدف فقط إلى توضيح العرض الفريد للمجموعة لوصف 
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المواهب التي يمكن اس تخدامها أو توظيفها. وكذلك؛ فإن ذكر اسم الشركة أو قدرتها في مجموعة 
مُحدّدة لا يعني أنها النشاط / العرض الوحيد لتلك المنظمة. والهدف الرئيس؛ هو التركيرٌ على 
القدرات التحليلية المختلفة داخل كلّ عنصر من عناصر حيّز التحليلات. وتعمل العديدُ من الشركات 
في قطاعات متعددة داخل صناعة التحليلات» "T‏ توفر فرضًا للحركة داخل المجال أفقيًا ورأسيًا. 

ولقدقام مات تراك oy éL à gg - (Matt Turck)‏ المال مع فرست مارك 
)۴M2۲(‏ - بتطوي ر نظام بيئي للتحليلات يركز على البيانات الضخمة: ويه دف 
إلى تتبع اللاعبين الجدد والقدامى في مختلف قطاعات صناعة البيانات الضخمة. وتُوجَد 
صورة مرئية جميلة من تفسيره للنظام البيئي وقائمة شاملة من الشركات على موقعه: 
http://mattturck.com/2016/02/01/Big-data-landscape/(accessed ^ August 2016)‏ 
وسنرى أيضاً نظامًا بيئيًا مشابهًا في سياق إنترنت الأشياء (101) في الفصل الأخير. 
مُورّدو البنية التحتية لتوليد البيانات: 

قد يكون من الأولى أن نبدأ بالتعرّف على هذه المجموعات من خلال ملاحظة مجموعة 
جديدة من الشركات التي تمكّن من توليد وجمع البيانات التي يمكن استخدامها لتطوير رؤى 
تحليلية. وعلى الرغم من Ol‏ هذه المجموعة يمكن أن تشمل جميع النقاط التقليدية من أنظمة 
البيع» وأنظمة إدارة المخزونء ومُقدَّمِيٍ التقنية لكلّ خطوة في سلس لة عمليات/ قيمة الشركة, 
سننظر أساسًا في اللاعبين الجدد حيث كان التركيرٌ الأسامي على تمكين المنظمة من تطوير رؤى 
جديدة لعملياتها بدلا من تشغيل عملياتها الأساسية. وبالتالي تشمل هذه ا مجموعة شركات 
إنشاء بنية تحتية لجمع البيانات من مصادر مختلفة. 

ومن المكونات الناشئة لمثل هذه البنية التحتية هو جهاز الاستشعار. حيث تقوم أجهزة 
الاستشعار بجمع كمية هائلة من البيانات بمعدل أسرع., وقد 3 اعتمادها من قبل قطاعات 
مختلفة. مثل: الرعاية الصحية؛ والرياضة» والطاقة. على سبيل المثالء البيانات الصحية التي 
تجمعها تستخدم أجهزة الاستشعار بشكلٍ ل عام لتتبّع الحالة الصحية للمستخدمين. وبعض أجهزة 
الاستشعار الرئيسة التي تقو تقوم بجمع المعلومات الصحية هي Shimmer «Google «AliveCor‏ 
وغنط)1ظ. وبالمثل؛ óe‏ صناعة الرياضة تستخدم أجهزة استشعار لجمع البيانات من اللاعبين 
والميدان لتطوير الإستراتيجيات وتحسين اللعب الجماعي. ومن أمثلة الشركات التي تنتجٌ أجهزة 
الاستشعار ذات الصّلة بالرياضة Shockboxg Zepps «Sports Sensors‏ وغیرها. كما تُستَخدّم 
أجهزة الاستشعار لإدارة الزيارات. ويساعد ذلك في اتخاذ إجراءات فورية à‏ للتحكّم «bb Jl à‏ 
ومن مورد ردي -Sensys Networks .Garmins .Advantech B-B SmartWorx ás42J! oAo‏ 
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وتلعبٌ أجهزة الاستشعار دورًا رئيسًا في إنترنت الأشياءء Ito ds‏ أساسيًا من الكائنات الذكية. 
وهي تجعل الاتصال بين آلةٍ وأخرى ممكنًا. والجهات الفاعلة الرئيسة في البنية التحتية لإنترنت الأشياء؛ 
هي إنتل (211آ)ء ومايكروس وفت «Google) Je-52 5 (Microsoft)‏ وآي في إن (1814): وسيسكو 
(Cisco)‏ وسمارت بين (Smartbin)‏ وسيكو ,529( lexssls (SIKO Products)‏ إنجنيرنج 
(Omega Engineering)‏ وأبل (Apple)‏ وإس إيه بي (582). وربما تكون هذه هي ال مجموعة 
الأكثر تقنيةً في النظام البيئي. وسوف نستعرضٌ النظام البيئي لإنترنت الأشياء "101 في الفصل الثامن. 
وفي الواقع؛ يُوجَد تقريبًا نظام čin‏ عن كل مجموعة من المجموعات التي „La lasi‏ 


مُورّدو البنية التحتية لإدارة البيانات: 


تضم هذه المجموعة جميعَ المنظمات الرئيسة التي توفر الأجهزة والبرامج التي تفسّر الأساس 
الجوهري لجميع حلول إدارة البيانات. ومن الأمثلة الواضحة على ذلك كبار الجهات التي توفر 
البنية التحتية لحوسبة قواعد البيانات. مثل: /181, Oracles HPg Dellg‏ وما إلى ذلك ومورّدو 
حلول التخزينء مثل 1٥‏ (والتي اشترتها 5611 مؤخرًا) وم1614 والشركات التي تقدِّم منضّات 
الأجهزة والبرمجيات ال محلية مثل 1814 و0621 وتيراداتاء ومورّدو حلول البيانات الذين يقدٌّمون 
dall‏ مستقلةٌ لإدارة قواعد البيانات للأجهزة jo SQL Server ile Jio gall‏ مايكروسوفت 
uod £355 (Microsoft)‏ هذه المجموعة أيضاً مورّدو البرامج المتكاملة التخصّصة SAP Jis‏ 
كما تشتملٌ هذه المجموعة على منظمات أخرىء مثل مورّدي أجهزة قواعد البيانات ومقدّمي 
الخدمات والدامجين والمطورين وغيرهمء ممّن يدعمون النظم البيئية لهذه الشركات. 

وتظهر العديدٌ من الشركات الأخرى باعتبارها لاعبين أساسيين في مجالات ذات alo‏ وذلك 
بفضل البنية التحتية للشبكة التي تمكّن الحوسبة السحابية. وقد اشتهرت شركات مثل (خدمات 
.IBM (Bluemix)5 (Amazon qj» c4 59)l‏ وددهء.عه5216510 بتقديم حلول مستودعات 
البيانات والتحليلات الكاملة عبر السّحابة» والتي تمّ الآن اعتمادها من الشركات المذكورة. 

وهناك مجموعة حديثةٌ من الشركات في مجال البيانات الضخمة تُعَذَّ هي كذلك جزءًا من 
هذه المجموعة. ولا تقوم 5,5 I gù özg JL Hortonworkss Cloudera |J. i‏ 8542 
الخاصة بهم؛ ولكنهم يقدّمون خدمات البنية التحتية والتدريب؛ لإنشاء منصة البيانات الضخمة. 
Flume .Kafkas .Sparks .NoSQL s .MapReduces -Hadoop cL e 22x (Ja. 2o Vig‏ 
وغيرها من التقنيات المرتبطة بالتحليلات. وبالتالي؛ يمكن أيضاً تجميعهم تحت إشراف استشاريين 
أو مدربين لتمكين البنية التحتية. إِنَّ النظم البيئية الكاملة للاستشاريين وتكامل البرمجيات» 
ومُقدّمي التدريب وغيرهم من مُقدّمِي خدمات القيمة المضافة قد أفادت العديد من اللاعبين 
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نظرة عامة على ذكاء الأعمال والتحليلات وعلم البيانات 


الكبار في مجموعة البنية التحتية لإدارة البيانات. وتعمل بعضٌ المجموعات المذكورة أدناه على 
تحديد هؤلاء اللاعبين؛ لأن العديد منهم ينتقلُ إلى التحليلات؛ إذ إِنَّ الصناعة تحوّل تركيزها من 
معالجة المعاملات بكفاءة إلى اشتقاق القيمة التحليلية من البيانات. 
مُورّدو مستودعات البيانات: 

توفّر الشركات التي تركز على مستودعات البيانات التقنية والخدمات التي تهدف إلى دمج 
البيانات من مصادر متعددة. وبالتالي تمكينْ المنظمات من اس تخلاص وتقديم قيمة من أصول 
البيانات الخاصة بها. وتوفر العديد من الشركات في هذا المجال الأجهزة الخاصة بهم لتوفير 
مستودعات البيانات بكفاءة واسترجاعها ومعالجتها. تُعَدَُ شركاتٌ مثل 1831 وعا0ه0 و 
8 من اللاعبين الأمساسيين في هذا المجال. وتشملُ التطورات الأخيرة في هذا المجال أداء 
التحليلات على البيانات مباشرةً في الذاكرة. وهناك قطاع نموٌ كبير آخر هو مستودع البيانات في 
السّحابة» ومن أمثلة هذه الشركات 5001121 وغلنط805. وتعمل الشركات في هذه المجموعة 
بوضوح مع جميع الجهات الأخرى في القطاع؛ من أجل توفير حلول وخدمات مستودع البيانات 
ضمن نظامها البيئي وبالتالي تصبح العمود الفقري لصناعة التحليلات. لقد كانت صناعةً رئيسة 
في حَذَّ ذاتهاء وبالتالي» مورّد ومستهلك للمواهب التحليلية. 


مُورّدو البرمجيات الوسيطة: 


بدأ مستودعٌ البيانات بالتركيز على جلب جميع مخازن البيانات إلى منصة على مستوى 
المؤسسة. وأصبح إنشاءٌ مغزى لهذه البيانات صناعةٌ في حَدٌ ذاتها. ويتمثل الهدف العام لقطاع 
البرمجيات الوسيطة في توفير أدوات سهلة الاستخدام للتقارير أو التحليلات الوصفية» والتي تشكّل 
جزءًا أساسيًا من ذكاء الأعمال أو التحليلات المُستخدّمة في المنظمات. ومن أمثلة الشركات في هذا 
لمجال «Microstrategy. Plum‏ وغيرها الكثير. وقد تم الاستحوادةٌ على عدد قليلٍ من كبار اللاعبين 
الذين كانوا وسطاء مستقلين من قبل الشركات في أول مجموعتين. فعلى سبيل المثال» أصبحت 
مم11 جزءًا من أوراكل واستحوذت 582 على 5اء06[6 512655نا8: واستحوذت 18341 على 
5 وقد كان هذا القطاعٌ مرادفًا لمورّدي ذكاء الأعمال الذين يقدمون إلى الصناعة خدمات 
لوحة المعلومات والتقارير والتصوير؛ بناءً على بيانات معالجة المعاملات وقاعدة البيانات وموزّدي 
مستودعات البيانات. وهكذا انتقلت العديدٌ من الشركات إلى هذا المجال على مرٌ السنينء بما 
في ذلك مُورّدو برامج التحليلات العامة مثل 545 أو مُقدِّمو خدمات مرئية جديدة مثل تابلوه 
(Tableau)‏ أو العديد من podih‏ التطبيقات المتخصّصة. ويورد سجل المنتجات في .1211/1" 
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الفصل الأول 


1 هده موردًا فقط في هذه الفئة؛ وذلك اعتبارًا من يونيو 017؟؛ لذلك كان القطاع قويًا. 
(http://www.tdwidirectory.cona/category/business-intelligence-services)‏ — ومن 
الواضح أنَّ هذا هو القطاع الذي يحاول الانتقال إلى قطاع علم البيانات في الصناعة. 
مُورّدو خدمة البيانات: 

يتم توليدٌ الكثير من البيانات التي تستخدمها المنظمة للتحليلات داخليًا من خلال عملياتها. 
ولكن هناك العديدٌ من مصادر البيانات الخارجية التي تلعب دورًا رئيسًا في اتخاذ القرار بالمنظمات. 
وتشمل أمثلة مصادر البيانات هذه بيانات التركيبة السكانية, وبيانات الطقسء والبيانات التي تمّ 
جمعها من قبل أطراف ثالثةء والتي يمكن أن تمد المنظمة بمعلوماتٍ مفيدة في lag hAl auo‏ 
إلى ذلك. وقد انتهز العديدٌ من الشركات الفرصة لتطوير آليات جمع وتكامل وتوزيع البيانات 
المتخصّصة. وترمّز هذه الشركات عادةٌ على قطاع صناعي مُحدَّد وتستندٌ إلى علاقاتها القائمة 
في هذه الصناعة من خلال منصاتها المتخصّصة وخدماتها لجمع البيانات. فمثلاً؛ توفر شركة 
هع 1615 مصادر بيانات لعملائها حول سلوك الشراء بالتجزئة للعملاء. مثالٌ آخر هو شركة 
älg Experian‏ تجمع بيانات عن كلّ أسرة في الولايات المتحدة. وقد طوّرت شركة ععدااتمنص© 
i5‏ لجمع نقرات الويب ومشاركة هذه البيانات مع عملائها. وتُعَد Sao} Comscore äSà‏ 
كبرى الشركات في هذا المجال. وتقوم Google‏ بتجميع بيانات مواقع الإنترنت الفردية وتقوم 
بعمل مُلخص متاح من خلال خدمات تحليلات جوجل. ومن الأمثلة الأخرى 5 «Equifax c»6$‏ 
fa às ol jag .Aventions «Epsilons .Merkles .Acxioms .TransUniong‏ ذلك أيضاً 
ESRLorg Qo cola. lai‏ والتي توفر بيانات مُوجَّهة بمواقع عملائها. وهناك مئات الشركات 
الأخرى التي تقوم بتطوير منصات وخدمات متخصصة لجمع وتكامل ومشاركة هذه البيانات 
مع عملائها. وكما ذكرنا سابقًاء يُوجَد العديدٌ من دامجي ومُورّعي البيانات الخاصة بالصناعة, 
وهم دائمو الحركة لعرض خدمات التحليل الخاصة بهم. وبالتالي؛ يُعَذ هذا القطاعٌ أيضاً متزايد 
الاستخدام» وموردًا محتملًا agh‏ التحليلات. وخصوصًا مع خبرة مُتخصّصة مُحدّدة. 


مُطوّرو البرامج التي تركّز على التحليلات: 

قامت الشركاتُ في هذه الفئة بتطوير برامج التحليلات للاستخدام العام مع البيانات التي تم 
جمعها في مستودعات البيانات أو ا متاحة من خلال إحدى المنصات الأساسية المُحدّدة سابقًا le)‏ 
في ذلك البيانات الضخمة). كما يمكن أن تشمل المخترعين والباحثين في الجامعات وغيرها من 
المنظمات التي طوّرت الخوارزميات وابتكار أنواع مُحدّدة من تطبيقات التحليلات. وهكننا تحديذ 
JUS‏ اللاعبين في هذا المجال باستخدام أنواع التحليلات الثلاثة: الوصفية: والتنبؤية» والتوجيهية. 
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- إعداد التقارير/ التحليلات الوصفية: لقد تسَنّى alash PLII‏ التقارير أو التحليلات الوصفية 
من خلال الأدوات التي وذّرها مش غلو البرمجيات الوسيطة المشار إليها سابقًء أو الإمكانات 
الفريدة التي يُقدّمها مُقدّمو الخدمات المعنيون. فمثلاً؛ تتضَمّن مجموعة أدوات SQL‏ 
äs åJ å lil Server BI‏ مايكروسوقت (810501) إمكانيات إعداد التقارير فضلاً عن 
التحليلات التنبؤية. ومن ناحية أخرى؛ يتوفر برنامجٌ متخصصٌ من شركاتٍ أخرى مثل تابلوه 
spay (Tableau)‏ البيانات. كما تُقدّم 545 أداة التحليلات المرئية ذات السعة نفسها. 
وهناك العديدٌ من أدوات التصوير المجانية أيضاً. وقد تمّ تطويرٌ مئات أدوات تصوير البيانات 
في جميع أنحاء العالم وتركّز العديدٌ من هذه الأدوات على رؤية البيانات المتوفرة لصناعة أو 
مجال معين. ولأن التصويرٌ هو الطريق الأساسي حتى الآن لاستكشاف التحليلات في مجال 
الصناعة؛ Nio g$ sä‏ القطاع نموًا أكبر. ويتم حاليًا تأسيسٌ العديد من الشركات الجديدة. 
فمثلاً رز برنامج نامء المجاني والمفتوح المصدر على تصوير الشبكات. وسوف يظهر في 
asl Google de Cal‏ قائمة لمقدّمي مثل هذه البرامج والأدوات. 
- التحليلات التنبؤية: ولعلّ هذه الفئة قد شهدت أكبر نمو في العصر الحديث في مجال التحليلات» 
وهناك عددٌ كبيرٌ من الشركات التي تركّز على التحليلات التنبؤية. وقد تبَنّت العديدٌ من 
شركات البرمجيات الإحصائيةء مثل 545 و5855 التحليلات التنبؤية في وقتٍ مبكرء كما طؤّرت 
إمكانيات البرامج» وكذلك ممارساتٌ الصناعة لاستخدام أساليب التنقيب في البيانات والأساليب 
لإحصائية الكلاسيكية للتحليلات. ومن أمثلة الأدوات المُستخدّمة للتحليلات التنبؤية -]/1181 
Enterprise Miners [BM ù SPSS Modeler‏ من -SAS‏ ويشمل اللاعبون الآخرون في هذا 
لجال شرکة KXEN‏ وStatsoft‏ (التي اشترتها 611 مؤخرً) وقدطعأةتز5 521104 وكثيرٌ من 
الشركات الأخرى التي قد تبيع برامجها على نطاق واسع أو تستخدمها في ممارسات الاستشارات 
لخاصة بها (المجموعة التالية من الشركات). 
كما ظهرت ثلاث منصات مفتوحة المصدر أخرى» 25 colgels (KNIMEs RapidMiners R)‏ 
برمجية شائعة في المجال الصناعي للتحليلات التنبؤيةء ولديها شركاتٌ تدعم تدريب وتنفيذ هذه 
لأدوات المجانية. مثل شركة gks de 35 glg Revolution Analytics‏ ۸ والتدریب. 
ویکون تکامل 1 ممكنًا مع معظم برامج التحليلات. وتستخدم شركة تدعى 41165752 امتدادات 
لإعداد التقارير والتحليلات التنبؤية» غير أن قوتها تكمنُ في تقديم عمليات حلول التحليلات إلى 
العملاء وا مستخدمين الآخرين بشكلٍ مشترك. وبالمثل؛ فإن Lajl ls KNIMEs RapidMiner‏ 
أمثلة بمورّدي البرامج مفتوحة المصدر. كما أن شركات مثل 56نا101016 التي تبيع متغيرات الملكية 
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من «NeuroDimensions 5 Decision Tree gl,‏ وهي „Neural Network Oloy 4S‏ 
هي أمثلةً على الشركات التي طوّرت برامج مُتخصّصة حول أساليب مُحدّدة للتنقيب في البيانات. 
- التحليلات التوجيهية: يُقذّم مُورّدو البرمجيات في هذه الفئة أدواتٍ النمذجة والخوارزميات؛ من 
أجل تحسين أمثل للعمليات التي عادةً ما تُسمّى برمجيات علم الإدارة/ بحوث العمليات. وكان 
لهذا ا لمجال مجموعةٌ خاصةٌ من كبار مورّدي البرمجيات. فعلى سبيل المثالء لدى 18۷ برامج 
البرمجة الخطية الكلاسيكية: والمختلطة: والبرمجة الصحيحة. وقبل عدة سنوات» استحوذت 
4 أيضاً على شركة تُدعَى 11.06 والتي تقدّم خدماتٍ التحليل التوجيهي والخدمات 
التكميلية لتكمّل عروضها الأخرى. ومُقدَّمو التحليلات مثل 545 لديهم أدوات OR/MS‏ 
الخاصة .SAS/OR - ee)‏ واستحوذت شركة 1100 على شركة أخرى تُسمّى XPRESS‏ $ 
برنامجًا للتحسين. وتشمل الجهات الفاعلة الرئيسة الأخرى في هذا المجال شركات مثل 2111/5 
«NGDatas .Maximals .Lindo Systemss .Gurobis .GAMSs Frontlineg .AMPLs‏ 
Š layt Ayatag‏ إن التحديد والوصف التفصيلي لعروض هذه الشركات هو خارج نطاق 
أهدافنا هنا. ويكفي القول بأنَّ هذا القطاع الصناعي قد شَّهِدَ نموًا كبيرا في الآونة الأخيرة. 
وبالطبع؛ يُوجّد العديدُ من الأماليب التي تندرج تحت فئة التحليلات التوجيهية. ولكلّ 
Ae samo lio‏ خاصةٌ بها من مُقدِّمِي الخدمات. فعلى سبيل المثال؛ يتم تقديمٌ برامج المحاكاة 
من قبل الشركات Slinkg Rockwell (ARENA) Jio GSI‏ ويوفر 2011506 الأدوات التي 
تتضمّن العديد من فئات البرامج. وبا مثلء Frontline pia‏ أدوات للتحسين باستخدام جداول 
JI ilayh Excel Sloty‏ التحليلات التنبؤية. وهكن تنفيذ تحليل القرار في إعدادات متعددة 
الأغراض باستخدام أدوات مثل عءذهط0 6.ءم<8. وهناك أيضاً أدوات من شركات Exsys Jis‏ و 
lagts XpertRule‏ لإنشاء قواعد بشكلٍ مباشر من البيانات أو مدخلات الخبراء. 
وتتطوّر بعص الشركات الجديدة لتجمع بين نماذج التحليلات المتعددة في مجال البيانات 
الضخمة: بما في ذلك تحليل الشبكات الاجتماعية» والتنقيب في تيار البيانات. فعلى سبيل المثال» 
Teradata Aster p—s‏ إمكانيات التحليلات التنبؤية التابعة له في معالجة تدفقات البيانات 
الضخمة. وقد قامت العديدٌ من الشركات بتطوير محركات معقدة معالجة الأحداث (0182) تتخل 
قرارات باستخدام بيانات التدفق» (Microsoft) CSgwg Solas IBM Infosphere Streams (Jis‏ 
Oracle Event Processors StreamlInsights‏ أمّا الشركاث الكبرى الأخر: ى التي تمتلك منتجات 
محركات معالجة الأحداث a iell‏ فتش SAPs dnformaticas .Tibcos «Apache Ja.‏ 9 
خطءه]111. وتجدرٌ الإشارة مردً أخرى إلى أنَّ مجموعات المورّد لجميع فئات التحليلات الثلاث ليست 
حصريةً. وفي معظم الحالات؛ يمكن للمورد أن يلعب في مكونات متعددة من التحليلات. 
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ed s‏ بعد ذلك «البتلات الداخلية» لزهرة التحليلات. ويمكن تسمية هذه المجموعات 
مسرعات التحليلات. وعلى الرغم من أنهم قد لا يشاركون في تطوير التقنية مباشرةً؛ فقد لعبت 
هذه المنظمات دورًا رئيسًا في تشكيل هذه الصناعة. 


مُطوّرو التطبيق: صناعة مُحدّدة أو عامة: 

تستخدم ال منظماتٌ في هذه المجموعة معرفتها الصناعيةء وخبرتها التحليليةء وحلولها المتاحة للبنية 
التحتية للبيانات» ومستودعات البيانات, والبرامج الوسيطة ومجمّعي البيانات ومُقدمي برامج التحليل 
الآلي لتطوير حلول مُخصّصة لصناعة معينة. وبالتالي؛ تتيح هذه المجموعة الصناعية إمكانية استخدام 
تقنية التحليلات في صناعة معينة. وبالطبع؛ قد تُوجَّد مثل هذه المجموعات أيضاً في منظمات مستخدمين 
مُحدّدة. ومن الواضح أَنَّ معظم مُورّدي تقنية التحليلات الأساسيين Teradatas SASs IBM Jia‏ 
يتعرفون على فرصة الاتصال بصناعة مُحدّدة أو عميل مُحدَّد وتقديم خدمات استشارية تحليلية. تقوم 
الشركاثٌ التي قدّمت بشكل تقليدي حلول بيانات/ تطبيقات لقطاعات مُحدّدة بتطوير عروض تحليلية 
خاصة بالصناعة. فعلى سبيل المثال» eX‏ شركة :066 حلول السجلات الطبية الإلكترونية لمقدّمي 
الخدمات الطبية. وتشمل عروضها الآن العديدٌ من تقارير التحليلات والمرئيات. وبامثل تدم شركة 
6 محرك كشف الاحتيال لصناعة التأمين الصحيء وتعمل مع شركة تأمين لاستخدام منصة تحليلات 
1150 الشهيرة في مساعدة مُقدّمِي الخدمات الطبية وشركات التأمين في التشخيص وإدارة المرض. 
ومن الأمثلة الأخرى على مُورّدي تطبيقات رأسية 5أذعهاهصدء16 5006 التي تُقَدّم حلولًا تحليليةٌ 
لصناعة السّفر بما في ذلك تسعير التعريفات لتحسين الإيرادات وتخطيط الإرسال. 

وتشمل هذه المجموعة أيضاً الشركاتٍ التي طوّرت حلول تحليلات خاصة بمجالها وتسوقها 
على نطاق واسع لقاعدة العملاء. وعلى سبيل المثالء تقوم ib; Sportvisiong IBM 5 «Nike‏ 
تطبيقات في التحليلات الرياضية لتحسين اللعب وزيادة نسبة المشاهدة. ولقد طوّرت Acxioni‏ 
مجموعات لكل المنازل في الولايات المتحدة تقريبًا استنادًا إلى البيانات التي تجمعها حول الأسر 
من مصادر مختلفة. وتنتمي شركات إعداد التقارير ذات الدرجات الائتمانية والتصنيف »۴1٥0(‏ 
وصهنءم:8... إلخ) أيضاً إلى هذه المجموعة. وتقدّم 1834 والعديد من الشركات الأخرى حلول 
تحسين الأسعار في قطاع بيع التجزئة. 

ويمثل هذا المجال فرصةً رياديةَ لتطوير تطبيقات خاصة بالقطاع. ويحاول الكثيرون الذين 
يظهرون في تحليلات الويب/ الشبكات الاجتماعية/ المواقع أن يقوموا بتهيئة المستخدمين للاستهداف 
الأفضل للحملات الترويجية في الوقت المناسب. ومن أمثلة هذه الشركات وأنشطتها: تقوم شركة 
2 باستخدام بيانات الموقع لتطوير ملفات تعريف ا مس تخدمين/ المجموعات واستهداف 
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إعلانات الجوالء ومس تخدمي ملفات تعريف 101065122 على أساس استخدام البريد الإلكتروني. 
وتهدف شركة 0112114 إلى تحديد ال مس تخدمين من خلال جميع استخدامات الجهازء وتستهدف 
2 تمن ؟ الإعلانات التلفزيونية على أساس تحليل عادات مشاهدة التلفزيون لدى المستخدم. 

ولقد أنتج مو الهواتف الذكية صناعةً كاملةً ترز على تطبيقات تحليلات مُحدَّدة للمستهلكين وكذلك 
المؤسسات. فعلى سبيل المثال: يمكن لتطبيقات الهواتف الذكية مثل تصةقط5 أو 4منامطلمناه5 أو 
511 تحديد أغنية على أساس المشاهذات القليلة الأول ثم السماح للمستخدم باختيارها 
بغرض التشغيل/ التنزيل/ الشراء. وتستخدم ۷28 معلومات ال مرور الفورية التي يشاركها المستخدمون. 
بالإضافة إلى بيانات الموقع لتحسين التنقل. وتؤدي أدوات التعرّف iPhone e Siri Jis Oga)! de‏ 
JI Amazon Alexas Google Nows‏ العديد من تطبيقات التحليلات الأكثر تخصصًّا 
لأغراض مُحدّدة جدًا في التحليلات المطبّقة على الصور ومقاطع الفيديو والصوت والبيانات 
الأخرى التي يمكن التقاطها من خلال الهواتف الذكية و/أو أجهزة الاستشعار المتصلة. لقد 
رفعت الهواتف الذكية أيضاً من مورّدي الخدمات الاقتصادية «Uber tJ. ia «dS L4‏ 
Olas Curbs Lyftg‏ إِنَّ العديد من هذه الشركات؛ هي أمثلةٌ للتحليلات التي تؤدي إلى فرص 
أعمال جديدة. وتُعَدُ وسائلٌ التواصل الاجتماعي عبر الإنترنت مجالًا آخر ساخنًا في هذه المجموعة. 
ومما لا شك فيه أن I ga Facebook‏ الأساسي في مجال الشبكات الاجتماعية عبر الإنترنت يليه 
Le Leg LinkedIn Twitter‏ ذلك؛ فإِنّ الوصول العام إلى بياناتهم أذّى إلى ظهور شركات أخرى 
متعددة تقوم بتحليل بياناتها. فعلى سبيل المثال: تقوم عذنا©0همتآ بتحليل بيانات Twitter‏ وتوفیر 
الحلول لعملائهاء وبالمثل,» asd as‏ من الشركات الأخرى التي ترز على تحليل الشبكات الاجتماعية. 

ومن المجالات الموجّهة في مجال تطوير التطبيقات إنترنت الاشياء .10١‏ وتقومٌ العديدٌ من 
الشركات ببناء تطبيقات لصنع كائنات ذكية. فمثلاء طوّرت شركة 5.۸2۲۲81١‏ أنظمة اممراقبة 
الذكية عن بُعد لقطاعات النفايات وإعادة التدويرء وتعمل العديدٌ من المنظمات الأخرى على 
بناء العدّادات الذكية والشبكات الذكية والمدن الذكية والسيارات المتصلة والبيوت الذكية, 
وسلاسل التوريد الذكيةء والصحة المتصلة والتجزتة الذكية: وغيرها من الأشياء الذكية. 

وينمو هذا النشاط في بداية الأمر ليتحوّل إلى مرحلة انتقالية كبيرة بسبب مشكلات في التمويل/ 
الاستثمار والمشكلات الأمنية/ الخصوصية. وعلى الرغم من ذلك؛ فقد يكون قطاع مطؤري التطبيقات 
هو أكبرٌ مجالٍ للنمو داخل التحليلات في هذه المرحلة. وتوفر هذه المجموعة فرصةً فريدةً لمحترفي 
التحليلات الذين يبحثون عن المزيد من خيارات مهنة تنظيم المشاريع. 
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مُحلّلو صناعة التحليلات والمؤثرون فيها: 

وتشمل اط مجموعة التالية من صناعة التحليلات ثلاثة أنواع من المنظمات أو ام محترفين؛ 
المجموعة الأولى هي مجموعةٌ من المنظمات المهنية التي تُقَدّم ا مش ورة إلى مودي صناعة 
التحليلات والمستخدمين. تشمل خدماتهم تحليلات تسويقية وتغطية التطورات الجديدة وتقييم 
تقنيات مُحدَّدة وتطوير التدريب/ الورقات البيضاء وما إلى ذلك. ومن أمثلة هذه المجموعة 
منظمات مثل مجموعة جارتنر. ومعهد مستودعات البيانات: „McKinsey g Forrester g‏ 
والعديد من المنشورات العامة والفنية ومواقع الويب التي تغطي صناعة التحليلات. وتتميز 
مجموعة ماجيك كوادرانتس التابعة لمجموعة جارتنر بكونها مؤثرةً للغاية وتعتمد على عمليات 
المسح في الصناعة. وباب مثلء يودر محترفو 101.0۲ لمحاتٍ عامة ممتازة عن الصناعة» وهم 
يدركون تامًا الاتجاهات الحالية والمستقبلية لهذه الصناعة. 

وتضم المجموعة الثانية مجتمعات أو شركات مهنية تقدِّم أيضاً بعضًا من الخدمات نفسها؛ 
ولكنها قانمة على أساس منظم. فعلى سبيل اممثال: يركز الآن معهدٌ بحوث العمليات وعلم الإدارة 
5 1ه وهي شركة مهنيةء على تعزيز التحليلات. وتركز مجموعة المصالح الخاصة لدعم 
القرار والتحليلات» وهي مجموعة فرعية تابعة لرابطة نظم المعلومات, أيضاً على التحليلات. كما 
أنَّ لدى معظم المورّدين الرئيسيين (مثل: تيراداتاء و545) مجموعات المستخدمين الخاصة بهم. 
وتشجّع هذه الكيانات استخداء التحليلات وتمكّن من مشاركة الدروس المستفادة من خلال 
منشوراتها ومؤتمراتهاء وقد توفر أيضاً خدمات التوظيف. وبالتالي» مصادر جيدة لتحديد المواهب. 

أما المجموعة الثالثة من المحلّْلين في مجال التحليلات؛ فهي ما نسميه سفراء التحليلات» أو 
المؤثرين» أو القائمين بالدعاية. وقد أبدى هؤلاء المحللون حماسهم للتحليلات من خلال حلقاتهم 
الدراسيةء وكتبهم ومنشورات أخرىء وتشمل هذه المجموعة على سبيل المثال لا الحصر ©5160 
bill Franks Wayne Eckersong «Charles Duhiggs .Tom Davenports «Baker‏ 9 
bill Inmang Claudia Imhoffg Malcolm Gladwell‏ وغيرهم. ولدى ds‏ هؤلاء السفراء 
مؤلفات (بعضها من الكتب الأكثر مبيعًا) و/أو قدّموا العديدَ من العروض التقديهية لترويج تطبيقات 
التحليلات. وقد يكون هناك مجموعةٌ أخرى من المؤثرين لذكرها هناء وهم مؤلفو الكتب المدرسية 
عن تحليلات ذكاء الأعمال الذين يهدفون إلى مساعدة المجموعة التالية لإنتاج محترفي صناعة 
التحليلات. ومن الواضح أنَّ الأمر سيستغرق بعض الوقت؛ لكي يصبح طالبٌ التحليلات عضوًا في 
هذه المجموعة؛ ولكنه يستطيع العمل مع أعضاء من هذه المجموعة كالباحثين أو المتدربين. 
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المعاهد الأكاديمية ووكالات الاعتماد: 

تستمدٌ (Sd‏ صناعة كثيفة المعرفة, مثل التحليلات؛ قونَها الأماسية من جذب الطلاب المهتمين 
بالتقنية واختيار هذه الصناعة كمهنة لهم. وتلعبُ الجامعات دورًا رئِيسا في جَعْل ذلك ممكنًا. 
وتُقدّم هذه المجموعة, البرامج الأكادهية التي تُعَدّ المهنيين لهذه الصناعة. وهي تشملٌ مكونات 
مختلفةً من كليات إدارة الأعمال. مثل نظم المعلومات والتسويق وعلوم الإدارة وما إلى ذلك. 
كما هد إلى ما هو أبعد من المدارس التجارية لتشمل أقسام علوم الحاسب والإحصاء والرياضيات 
والهندسة الصناعية في جميع أنحاء العام. كما تمتدٌ كذلك لتشمل ما يتجاوز مُطوّري الرسومات 
الذين يُصمّمون طرقًا جديدةٌ لتصوير المعلومات. وتقدِّم الجامعات برامج البكالوريوس والدراسات 
العليا في التحليلات في جميع هذه التخصصات, على الرغم من اختلاف التسميات. وقد اشتملت 
إحدى نطاقات النموٌ الرئيسة في برامج الشهادات على التحليلات؛ لتمكين المتخصّصين الحاليين من 
إعادة تدريبهم وإعادة تنظيم أنفسهم في وظائف التحليلات. وتمكْن برامج الشهادات الممارسين 
من اكتساب الكفاءة الأماسية في برامج معينة عن طريق الحصول على عدد قليلٍ من الدورات 
المهمة بالمدارس التي تقدّم هذه البرامج. وتتضمّن شبكة جامعة تيراداتا قاممةٌ ببرامج التحليلات, 
والتي تشمل 10١‏ برنامجًا تقرييه وتتزايد يوميًا. 

وتساعدٌ مجموعة أخرى من اللاعبين في تطوير الكفاءة في التحليلات. وهذه هي برامج 
الشهادات التي تمنخ شهادة الخبرة في برامج مُحدَّدة. ويقدّم كلّ مورّدي التقنية الأساسية تقريبًا 
(IBM) el y ")‏ ومایکروسوغ (Microsoft)‏ ومايكروستراتيجي )Microstrategy)‏ وأوراکل 
volalg 2278 gal js s[(Teradata) 13h35 (Tableau) osbBs (SAS) 541 45! oela (Oracle)‏ 
الخاصة بها. وتضمّن هذه الشهاداتٌ أن يتمتع الموظفون المحتملون ]3959 52 معين من 
الأدوات المهارية. ومن ناحية أخرى؛ تقدّم 12150781315 برنامج شهادة دعناترلهصى لعظنا0 
81 والذي يهدف إلى اختبار الكفاءة التحليلية العامة لشخص ما. أي إِنَّ هذه 
الشهادات تمنح الطالب الجامعيّ مهارات إضافيةٌ قابلةً للتسويق. 

Së Lx)‏ البرامج الأكاديمية في التحليلات أمرًا مذهلًا. ويُحدّد الوقت فقط ما إذا كانت هذه 
المجموعة تفرط في زيادة السعة التي يمكن أن تس تهلكها المجموعات الأخرى. ولكن في هذه 
المرحلة. يبدو أن الطلبَ يفوق المعروض من خريجي التحليلات ال مؤهلينء وهذا هو المكانٌ الأكثر 
وضوحًا للعثور على مستخدمي التحليلات المبتدئين على الأقل. 
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المنظمون وصُنَاع السياسات: 

يُعتَبر اللاعبون في هذا المكوّن مسؤولين عن تحديد القواعد واللوائح الخاصة بحماية موظفي» 
M aes‏ وحاملي أسهم منظمات التحليلات. ويتطلّب جمعٌ ومشاركةٌ بيانات العميل قوانينَ 
صارمةً لتأمين الخصوصية. تقوم عدة منظمات في هذا المجال بتنظيم عملية نقل البيانات وحماية 
حقوق المستخدمين. فعلى سبيل المثال: تُنظّم لجنة الاتصالات الفيدرالية (7060) الاتصالات بين 
الدول والاتصالات الدولية. وبالمثل. فإن لجنة التجارة الفيدرالية (510) هى المسؤولة عن 
عرض الممارسات التجارية غير ا مشروعة المتعلقة بالبيانات. ويُنظّم الاتحاد الدولي للاتصالات 
(110) الوصول إلى تقنية المعلومات والاتصالات (1015) للمجتمعات غير المخدومة في جميع 
أنحاء العالم. ومن ناحية أخرى؛ يُوجَد وكالة فيدرالية غير نظامية تُسِمَّى المعهدُ الوطني للمعايير 
والتقنية (۸181)» تساعد على تقدّم البنية التحتية للتقنية. كما أنَّ هناك العديدَ من المنظمات 
الأخرى في جميع أنحاء العالم الني تنظم أمن البيانات وتدفع عجلة صناعة التحليلات. وهذا 
مكونٌ مهمٌ في النظام البيئي» وبالتالي لا يمكن لأحد أن يُسِيء استخدامَ معلومات المستهلكين. 

وبالنسبة لأيّ شخصٍ يقومٌ بتطوير أو استخدام تطبيقات التحليلات» رها يكون من الضروري 
أن يكون هناك شخصٌ ما في الفريق على علم بالإطار التنظيمي. ومن الواضح أنَّ هذه الوكالات 
والمنظمات المهنية التي تعمل معهم يقدّمون مواهبَ ومهارات فريدة في مجال التحليلات. 
منظمات مُستخدمي التحليلات: 

من الواضح أن هذا هو المحرك الاقتصادي تصناعة التحليلات بأكملهاء وبالتالي؛ فإننا نمثل هذه 
المجموعة باعتبارها جوهرٌ زهرة التحليلات. وإذا مم يكن هناك مستخدمون؛ فلن تكون هناك 
صناعةٌ تحليلات. إن المنظمات في كل delo‏ بغض النظر عن حجمها وشكلها وموقعها؛ تستخدمٌ 
أو تستكشف استخدام التحليلات في عملياتها. وتشمل هذه المنظمات القطاع الخاصء والحكومة 
والتعليم» والعسكرية» وما شابهها؛ بل وتشمل المنظمات في جميع أنحاء العالم. وهناك أمثلةٌ على 
استخدامات التحليلات في صناعات مختلفة كثيرة. ويستكشف آخرون فرضًا مماثلةً لمحاولة الحصول 
على مَيْزة تنافسية أو الاحتفاظ بها. وم يتم تحديدُ شركات مُحدَّدة في هذا القسم؛ وبدلًا من ذلك؛ 
فإن الهدف هنا هو معرفةٌ نوع أدوار محترفي التحليلات التي يمكن أن يلعبها داخل منظمة المُستخدم. 

وبالتاكيد؛ تُعَنَّ القيادةٌ العليا للمنظمة لا سيما في مجموعة تقنية المعلومات (مسؤول المعلومات» 
وما إلى ذلك)؛ أمرًا بالغ الأهمية في تطبيق التحليلات لعملياتها. ويقول 3/215 10115 من إمبراطورية 
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الفصل الأول 


5 للشوكولاتة: «إِنَّ جميعَ الإدارات تُغالي في تطبيق الرياضيات على عمليات واقتصاديات الشركة». 
وعلى الرغم من عدم تأييد عدد كاف من كبار المديرين لهذا الرأي؛ فإِنَّ الوعي بتطبيق التحليلات 
داخل المنظمة ينمو في كل مكان. ولقد أخبرنا مسؤول تنفيذي في شركة تأمين صحي ذات مرة أنَّ 
(المدير التنفيذي) ينظر إلى الشركة كمنظمة تمكّن تقنية المعلومات من جمع الأموال من الأعضاء 
امؤمّن عليهم وتوزعها على المورُدين. وهكذا كانت الكفاءة في هذه العملية؛ هي الخاصية التي يمكن 
أن يتفوقوا بها على المنافس. وقد أدَى هذا إلى تطوير العديد من تطبيقات التحليلات لتقليل الاحتيال 
وا مدفوعات الزائدة ممقدمي الخدمات» وتعزيز العافية GARLI gy‏ عليهم؛ حتى يستخدموا موزدي 
الخدمات معدل أقل من ا معتادء وتوليد ا مزيد من الكفاءة في المعالجةء وبالتالي تكون JS]‏ ربحيةٌ. 

ومن الناحية الفعلية؛ فإِن جميع المنظمات الرئيسة في كلّ صناعة محل الاهتمام؛ توظّف محترفي التحليلات 
تحت مُسميات وظيفية مختلفة. ويُعَدُ الشكل 16-١‏ تصويرًا لكلمة واحدة من عناوين مختارة من خريجي 
برنامجنا في جامعة أوكلاهوما الحكومية من عام ۲١۰٠۳‏ إلى عام Ol es ass ids V‏ تحليلات وعلم 
البيانات هي عناوين شائعة في المنظمات التي توظف خريجي هذه البرامج. وتظهر الكلمات الرئيسة الأخرى 
لنتضمّن مصطلحات مثل المخاطر وقواعد البيانات والأمن. والإيرادات والتسويق» وما إلى ذلك. 
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وبالطبع؛ تتضمّن منظماتٌ المستخدمين مساراتٍ مهنيةٌ لمحترفي التحليلات للانتقال إلى مواقع 
الإدارة. وتشمل هذه المسميات الوظيفية مديري المشروعات. وكبار المديرين» والقادة. وصولا إلى 
رئيس قسم المعلومات أو الرئيس التنفيذي. وهذا يشيرٌ إلى أنَّ منظمات المستخدمين موجودة 
كمجموعة رئيسة في النظام البيئي للتحليل, وبالتالي يمكن أن يكون مصدرًا جيدًا للمواهب. وربما 
يكون هذا هو المكان الأول لإيجاد محترفي التحليلات في قطاع الصناعة الرأسية. 

وكان الغرض من هذا القسم هو تقديمٌ لمحة سريعة clo ag åh je‏ التحليلات. وقد تم 
١١ d aded‏ مجموعةً مختلفةً تلعبُ دورًا رئيس ا في بناء هذه الصناعة وتعزيزها. ويمكن إضافة 
المزيد من البتلات/ المكونات بمرور الوقت في زهرة/ نظام التحليلات. ونظرًا لأن تحليلات البيانات 
c des‏ مجموعة متنوعةٌ من المهارات؟ فإن فهم هذا النظام البيئي D Ég‏ خيارات أكثر مما 
قد تتخيل لمهن التحليلات. وعلاوةً على ذلك؛ يمكن للمحترفين الانتقال من مجموعة صناعية إلى 
أخرى للاستفادة من مهاراتها. فعلى سبيل المثال: يمكن للخبراء المحترفين من مُقدّمِي الخدمات في 
بعض الأحيان الانتقال إلى مراكز الاستشارات» أو مباشرةً إلى منظمات المستخدمين. وبشكل عام؛ 
هناك الكثيُ مما يثِيدُ الحماسة حول صناعة التحليلات في هذه المرحلة. i‏ 


أسئلة مراجعة على القسم :۸-١‏ 

-١‏ قم بإدراج ١١‏ فئةٌ من اللاعبين في النظام البيئي للتحليل. 

؟- أعط أمثلةٌ لشركات في كل واحد من ال ١١‏ نوعاً من اللاعبين. 

'- ما هي الشركات المهيمنة في أكثر من فئة؟ 

Lasd ga Jo -é‏ أن تكونَ أقوى لاعب في فئة واحدة أو أن تكون نشطًا في فئات مُتعدّدة؟ 


9-١‏ خطة الكتاب: 

لقد منحتك الأقسامٌ السابقة dero Ua‏ تقنية المعلومات في صُنع القرا وتطوّر ذكاء الأعمال» 
والآن إلى التحليلات وعلم البيانات. وقد قدَّمنا في الأقسام العديدة الأخيرة نظرة le‏ على أنواع 
مختلفة من التحليلات وتطبيقاتها. والآن نحن مستعدون للقيام برحلة إرشادية أكثر تفصيلًا في 
هذه المواضيع؛ إلى جانب بعض الخبرة العملية العميقة في بعض ا موضوع ات الفنية» ويوضح 
الشكل ١0-١‏ خطة حول بقية الكتاب. 
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الاتجاهات المستقبلية 
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شكل :10-١‏ خطة الكتاب 

في هذا الفصل؛ تم عرض مقدمة وتعريفات ونظرة عامة على أنظمة دعم القرار 1555 وذكاء 
الأعمال والتحليلات» بما في ذلك تحليلات البيانات الضخمة وعلم البيانات. كما قدَّمنا نظرةً عامةٌ 
على النظام البيئي للتحليلات لتقدّر مدى اتساع وعمق هذه الصناعة. ويُعْطي الفصلان الثاني 
والثالث المسائل التحليلية الوصفية والبيانات. وتشكّل البيانات غالبًا الأماس لأيّ تطبيق تحليلي. 
وبالتالي نقومٌ بعرض مقدمة حول مسائل مستودعات البيانات والتطبيقات والتقنيات. ويغطي 
هذا القسمٌ أيضاً تقنيات وتطبيقات التقارير وتطبيقات الأعمال. ويتبع ذلك نظرة عامة مختصرة 
على أساليب وتطبيقات إدارة أداء الأعمال 8۲٥‏ وهو الموضوع الذي كان جزءًا أساسيًا من ذكاء 
الأعمال التقليدي. 





وَيُعْطي القسم التالي التحليلات التنبؤية؛ إذ يُقدّم الفصل الرابع مقدمةً لتطبيقات التحليلات 
التنبؤية» ويتضمّن العديدٌ من الفنيات الشائعة للتنقيب في البيانات وهي: التصنيف والتجميع 
وأساليب الترابط» Jail Syg lagis‏ الخامس على تطبيقات التنقيبب في النضٌ بالإضافة إلى 
تحليلات الويب. بما في ذلك تحليلات وسائل التواصل الاجتماعي وتحليلات المشاعر. وغيرها 
من الموضوعات ذات الصّلة. ويُعطي الفصل السادس التحليلات التوجيهية. ويتضمّن الفصل 
السابع مزيدًا من التفاصيل حول تحليلات البيانات الضخمة. ويتضمّن الفصل الثامن مناقشة 
الاتجاهات الحديثة الظهور. مما يؤدي إلى انتشار كلّ من الأجهزة اللاسلكيةء وأجهزة 2675 
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وأجهزة الاستشعار الأخرى وإنشاء قواعد بيانات ضخمة جديدة وتطبيقات فريدة من نوعها. 
وقد بدأت مجموعةٌ جديدةٌ من شركات التحليلات في الظهور لتحليل قواعد البيانات الجديدة 
هذه؛ من أجل فهم أفضل وأكثر عمقًا لس لوكيات وتصرّفات العملاء. وهو ما يؤدي إلى وَضْع آلية 
للتحليلات والتوشّع إلى مجال جديد GÀ ad‏ إنترنت الأشياء jail ghis IoT‏ أيضاً التحليلات 
المستندة إلى السحابة. وأخير؛ يحاول الفصلٌ الثامن أيضاً دمج جميع المواد التي يغطيها هذا 
الكتاب» ويُختتم بمناقشة موجزة لأبعاد الأمان/ الخصوصية في التحليلات. 


٠١-١‏ مواردء وروابطء واتصال شبكة جامعة تيراداتا: 
يمكن تعزيرٌ استخدام هذا الفصل ومعظم الفصول الأخرى في هذا الكتاب من خلال الأدوات 
الموضّحة في الأقسام التالية. 
الموارد والروابط: 
نوصي باطوارد والروابط الرئيسة التالية: 
The Data Warehousing Institute (tdwi.org)‏ - 
Data Science Central (datasciencecentral.com)‏ - 


- DSS Resources (dssresources.com) 


- Microsoft Enterprise Consortium (enterprise.waltoncollege.uark.edu/mec.asp) 


المورّدون والمنتجات والنسخ التجريبية: 
يُقدّم معظمٌ الموردين نسخًا تجريبية لمنتجاتهم وتطبيقاتهم. وتتوافر معلوماتٌ حول المنتجات 
والبنية والبرمجيات على „dssresources.com‏ 
النشرات الدورية: 
نوصي بالنشرات الدورية التالية: 
Decision Support Systems (www.journals.elsevier.com/decision-support-systems)‏ - 


- CIO Insight (cioinsight.com) 
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الفصل الأول 


اتصال شبكة جامعة تيراداتا: 

يرتبط هذا الكتاب ارتباطًا وثيقًا بالموارد المجانية التي تقدّمها شبكةُ جامعة تيراداتا (انظر: 
.)terdatauniversitynetwork.com‏ وتنقسم پوابة شبكة indo‏ تيراداتا إلى قسمين رئيسين: أحدهما 
للطلاب والآخر لهيئة التدريس. وهذا الكتابُ مرتبطً ببوابة شبكة جامعة تيراداتا عبر قسم خاص في 
نهاية كلّ فصل. ويتضمّن هذا القسمٌ روابط مناسبةً للفصل المحَدّد. ويشيد إلى الموارد ذات الضّلة. كما 
ex;‏ تدريبًا عمليًًا باستخدام البرمجيات وغيرها من المواد (كالحالات) المتاحة في شبكة جامعة تيراداتا. 


موقع الكتاب على الإنترنت: 

موقع هذا الكتاب على الإنترنت هو: 2۲a‏ !ء/earsonhighered.c0nمp‏ ويحتوي على نص 
إضاف تكميلي منظم كفصول ويب تتوافق مع فصول الكتاب المطبوع. ويتمٌ سَرْدِ مواضيع هذه 
الفصول في جدول محتويات الفصل عبر الإنترنت. 

وَيُرجَى ملاحظة أنه في أثناء مثول هذا الكتاب للطباعة؛ تحققنا من أن جميع مواقع الويب 
التي تمّ الاستشهادُ بها كانت نشطةً وصالحة. وعلى أي حال؛ تكون عناوين 0۸1 ديناميكية. 
كما تتغيرٌ أحيانًا مواقع الويب التي نشيرٌ إليها في النص أو تتوقف بسبب تغيير الشركات لأسمائها 
أو شرائها أو بيعها أو دمجها أو تعطلها. وفي بعض الأحيان تكون مواقع الويب تحت الصيانة أو 
الإصلاح أو إعادة التصميم. وقد أسقطت العديدٌُ من المؤسسات البادئة ”77> من مواقعها؛ 
ولكن البعض الآخر لا يزال يستخدمها. وإذا واجهتك أي مشكلة في الاتصال بموقع الويب الذي 
oiz sS‏ التحلّي بالصبر وببساطة قم بعمل بحث على الويب؟ لمحاولة تحديد الموقع الجديد 
المحتمّل. والذي في الغالب سيمكنك العثور عليه بسرعة من خلال أحد محركات البحث الشائعة. 
ولا يسعنا إلا أن نعتذر مقدمًا عن هذا الإزعاج. 
تلخيص لأهمّ نقاط الفصل: 
- أصبحت بيئة الأعمال أكثْرٌ تعقيدًا وتتغير بسرعة؛ مما يجعل اتخاذ القرار أكثر صعوبةً. 
- يجب أن تستجيب الشركاتُ» وتتكيف مع بيئة التغيير بسرعة عن طريق اتخاذ قرارات أسرع وأفضل. 
- إن الإطار الزّمني لاتخاذ القرارات يتقلّصء في حين أن الطبيعة العالمية لصُنع القرار آخذة في 

التوسع؛ مما يستلزم تطوير واستخدام نظم إدارة أمن البيانات المحوسبة. 
- تستخدم أنظمةٌ دعم القرار البيانات والنماذج وأحيانًا إدارة المعرفة لإيجاد حلول للمشكلات 
شبه المهيكلة وبعض المشكلات غير الهيكلية. 
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- نّستخدم طرق ذكاء الأعمال مستودعًا مركزيًا يُسِمَّى مستودع البيانات والذي هكن من التنقيب 
في البيانات بكفاءة وتصوير البيانات. 

- وتشمل بنيةٌ ذكاء الأعمال مستودعات البيانات وأدوات تحليل الأعمال ا لمستخدّمة من قبل 
المستخدمين النهائيين وواجهة المستخدم (مثل لوحات المعلومات). 

- تستخدم doas‏ من المنظمات التحليلات الوصفية لتحلّ محل تقاريرها التقليدية المُسطّحة مع 

التقارير التفاعلية التي تقدَّم رؤى واتجاهات وأنماط في بيانات المعاملات. 

تمكّن التحليلاتٌ التنبؤية المؤسسات من وَضْع قواعد تنبؤية تُشجّع نتائج الأعمال من خلال 

تحليل البيانات التاريخي للسلوك الحالي للعملاء. 

- تساعد التحليلاتٌ التوجيهية في بناء النماذج التي تنطوي على أساليب التنبؤ والأمثلية على أساس 

مبادئ تقارير التشغيل وعلم الإدارة؛ لمساعدة المنظمات على اتخاذ قرارات أفضل. 

يركز تحليل البيانات الضخمة على مجموعات البيانات الكبيرة غير المهيكلة» والتىي 

قد تتضمّن أيضاً أنواعًا مختلفةٌ تمامًا من البيانات للتحليل. i‏ 

- تُعرف التحليلات كمجال بأسماء التطبيقات الخاصة بالصناعة, مثل التحليلات الرياضيةء وهو 
معروف أيضاً بأسماء أخرى ذات صلة مثل علم البيانات أو علم الشبكة. 

- إِنَّ الرُعاية الصحية وسلاسل بيع التجزئة؛ هما مجالان تكثر فيهما تطبيقات التحليلات والكثير 
من المجالات قادمة. 

- يمكن النظرٌ إلى النظام البيئي للتحليل لأول مرة على أنه مجموعةٌ من مُقدَّمِي الخدمة 
والمستخدمين والميسرين. يمكن تقسيمها إلى ١١‏ مجموعةٌ. 


مصطلحات أساسية: 





التحليلات الوصفية 


التحليلات ة ا لمعلومات 
التحليلات | لوج اللعلومات (أو إعداد التقارير) 





معالجة ابلعاملات الفورية (011) | النظام البيئي للتحليلات |التنقيب في البيانات 




















تحليلات البيانات الضخمة m,‏ أو التحليلات المعيارية | وكلاء الذكاء 
التحليلات التنبؤية ذكاء الأعمال (81) المعالجة التحليلية الفورية (2ه.آ0) 
التحليلات التوجيهية إخدمات الويب 
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أسئلة للمناقشة: 

-١‏ قم بإجراء مَسْح الدراسات منذ الأشهر الستة الماضية؛ للعثور على تطبيق JS) aos‏ من نُظم 
دعم القرار 055 وذكاء الأعمال والتحليلات. ولخّص التطبيقات في صفحة واحدة وأرسلها 
مع عرض دقيق. 

-١‏ ميّز بين ذكاء الأعمال ونظام دَعْم القرار. 

"- قارن وميّز بين التحليلات التنبؤية والتحليلات الوصفية والتحليلات التوجيهية. استخدم الأمثلة. 

؟- ناقش المشكلات الرئيسة في تطبيق ذكاء الأعمال. 


تمارين شبكة جامعة تيراداتا (11717) وغيرها من التمارين اليدوية: 

NER o hl jozo åS ela&zubs .teradatauniversitynetwork.com |J] اذھ‎ -١ 
معلمك» قم بالتسجيل في الموقع إذا لم تكن قد قمتّ بالتسجيل مسبقًا. قم بتسجيل الدخول‎ 
وتعرّف على محتوى الموقع. سوف تتلقى المهمات المتعلقة بهذا الموقع. قم بإعداد قائمة تضم‎ 
عنصرًا على الموقع تعتقد أنها قد تكون مفيدةً لك.‎ ٠ 

uasili œg Sports Analytics xio AèKusl اذهب إلى موقع شبكة جامعة تيراداتا.‎ -١ 
اثنين على الأقل من تطبيقات التحليلات في أي رياضة من اختيارك.‎ 

- ادخل إلى موقع شبكة جامعة تيراداتا. وحَدَّد «الحالات وا مشاريع والواجبات». ثم اختر دراسة 
«Harrahs High Payoff from Customer Information» å Jted}‏ أجب عن الأسثلة 
التالية حول هذه القضية: 

-١‏ ما هي المعلومات التي تنتج عن التنقيب في البيانات؟ 

؟- كيف تكون هذه المعلومات مفيدةٌ للإدارة في صُنع القرار؟ (كن دقيقًا.) 
۴- اذكر أنواع البيانات التي يتم التنقيب فيها. 

ع- هل هذا تطبيق 255 أو 81؟ وبلاذا؟ 

-٤‏ اذهب teradatauniversitynetwork.com d|‏ وقم بإيجاد الورقة بعنوان «مستودعات 
البيانات يدعم إستراتيجية الشركة في sl‏ شركة أمريكية» ش (بواسطة Watson‏ 
15I .(Goodhueg Wixomg‏ الورقة» وأجب عن الأسئلة التالية: 

-١‏ ما هي دوافع مشروع مستودع البيانات / ذكاء الأعمال في الشركة؟ 
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-١‏ ما هي المزايا الإستراتيجية التي تحققت؟ 
*- ما هي المزايا التشغيلية والتكتيكية التي تحققت؟ 
4- ما هي عوامل النجاح الحسّاسة بالنسبة للتنفيذ؟ 
-o‏ انتقل إلى SLzob e-35 http://analytics-magazine.org/issues/digital-editions‏ 
إصدار يناير / فبراير ١٠١۲م‏ بعنوان «مشكلة خاصة: مستقبل الرعاية الصحية». 
اقرأ «التحليلات التنبؤية - إنقاذ الأرواح وخفض الفواتير الطبية». أجب عن الأسئلة التالية: 
-١‏ ما هي المشكلة التي يتم تناولها من خلال تطبيق التحليلات التنبؤية؟ 
۲- ما هي درجة الالتزام بأدوية ۴1°0؟ 
*- كيف يتم التدريبٌ على نموذج التنبؤ بأدوية ©110؟ وهل صئّف نموذج التنبؤ درجة 
التزام الدواء في *FICO‏ 
ع- قم بتكبير الشكل 6 واشرح أَيّ نوع من الأساليب يتم تطبيقه على النتائج المتولدة. 
0- اذكر بعض القرارات القابلة للتطبيق التي تم استخدامها بناءً على نتائج التنبق. 
1- انتقل إلى SLeob e—35 .http://analytics-magazine.org/issues/digital-editions‏ 
إصدار يناير/ فبراير ١1‏ «العمل الاجتماعي». واقرأ المقالة «البيانات الضخمة والتحليلات 
والانتخابات». وأجب عن الأسئلة التالية: 
-١‏ ما هي أنواع البيانات الضخمة التي تم تحليلها في المقالة ه00؟ علّق على بعض مصادر 
البيانات الضخمة. 
؟- اشرح مصطلح النظام المتكامل. وما هو المصطلح الفني الآخر الذي يتناسب مع النظام المتكامل؟ 
#- ما هي أنواع أساليب تحليل البيانات المُستخدّمة في المشروع؟ علّق على بعض المبادرات 
التي نتجت عن تحليل البيانات. 
ع- ما هي مشكلات التنبؤ المختلفة التي حلّتها النماذج؟ 
-o‏ اذكر بعض القرارات القابلة للتطبيق التي تمّ اتخاذها والتي تستندٌ إلى نتائج التنبؤ. 
1- حَدّد تطبيقين لتحليلات البيانات الضخمة غير المُدرّجة في المقالة. 
1- ابحث في الإنترنت عن المواد المتعلّقة بعمل المديرين ويلعب دور تحليلات. ما هي أنواع 
المصادر للشركات الاستشارية والأقسام الأكادهية والبرامج التي تجدها؟ ما هي ال مجالات 
الرئيسة التي تمّ إعادة تصميمها؟ حَذَّد خمسة مواقع تغطي مجالاً واحداً. قدِّمِ نتائجك. 
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8- استكشف المناطق العامة من 20مع.وع0558650116. قم بإعداد قائمة بالموارد المتاحة الرئيسة. 
قد ترغب في الرجوع إلى هذا الموقع في أثناء عملك من خلال الكتاب. 

-٩‏ اذهب إلى »leob e$ .microstrategy.com‏ معلومات عن الأنماط الخمسة من ذكاء الأعمال» 
قم بإعداد جدولٍ ملخص hè JS‏ 

-٠‏ انتقل إلى aò Hyperion hlj de „älg coracle.com‏ التطبيقات. Sd‏ ما ھی منتجات 
الشركة الرئيسة. اربطها بتقنيات الدعم المذكورة في هذا الفصل. ١‏ 

-١‏ انتقل إلى موقع أسئلة شبكة جامعة تيراداتا. ابحث عن مقاطع فيديو 851. راجع مقطع 
الفيديو الخاص ب vasa slaeb e$ o3 .«Case of Retail Tweeters»‏ مكوّن من صفحة 
واحدة للمشكلة والحل المقترّح والنتائج التي تمّ تقديمها. ويمكنك أيضاً العثور على الشرائح 
-slideshare.net (Ae. 45 AL‏ 

- قم بمراجعة قسم النظام البيئي لبرنامج التحليلات. وحَدَّد ما لا يقل عن شركتين إضافيتين 
فيما لا يقل عن خمس مجموعات من الصناعات المذكورة في المناقشة. 

-W'‏ شملت المناقشةٌ المتعلقة بالنظام البيئي التحليلي أيضاً العديدٌ من عناوين الوظائف النموذجية 
لخريجي برامج تحليل وعلم البيانات. ابحث عن مواقع الويب مثل .لدمامءءءءعمع 0245 
Y Lo saoi tdwi.orgg com‏ يقل عن ثلاثة عناوين وظيفية مشابهة أخرى قد تجدها 
مشوقةً في حياتك المهنية. 
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التحليلات الوصفية )١(‏ 
طبيعة البيانات, النمذجة الإحصائيةء تصوير البيانات 


أهداف التعلّم: 
- فهم طبيعة البيانات من حيث صلتها بذكاء الأعمال والتحليلات. 
- تعلّم الطرق المُستخدّمة لتجهيز تحليلات البيانات الواقعية. 
- وَضْف النمذجة الإحصائية وعلاقتها بتحليلات الأعمال. 
- تعلّم الإحصاء الوصفي والاستدلالي. 
- تعريف تقارير الأعمالء وفهم تطؤرها التاريخي. 
- فهم أهمية تصوير البيانات/ المعلومات. 
- تعلّم أنواع مختلفة من تقنيات التصوير البياني. 
- تقدير القيمة التي تضيفها التحليلاث المرئية إلى تحليلات الأعمال. 
- معرفة قدرات وقيود لوحات ال معلومات. 

في عمر البيانات الضخمة وتحليلات الأعمال التي نعيش فيها؛ لا هكن إنكار أهمية البيانات. 
وهناك عبارات مُستَحدَّثة مثل: «البيانات هي النفط» «البيانات هي اللحم الجديد» «البيانات 
هى العملة الجديدة»» و«البيانات هى الملك»» هذه العبارات من شأنها أن تزيدَ من أهمية البيانات 
من جديد. ولكن عن أي نوع من البيانات نتحدث؟ من الواضح أننا لا نتحدث Gl oe‏ بيانات. 
إن مفهوم/ مبدأ المدخلات السيئة ينتج عنه مخرجات سيئة “garbage in garbage out-GIGO”‏ 
ينطبق على ظاهرة «البيانات الضخمة» في الوقت الحالي أكثر من أي بيانات في أي وقت سابق. ولكي 
lul olas‏ من الوفاء بوعدها وقيمة اقتراحها وقدرتها على التحول إلى رؤية واقعية؛ فلا بد من 
الاعتناء بإنشائها/ تحديدهاء وكذلك جمعها وتكاملها وتنظيفها وتحويلها ووضعها بصورة صحيحة 
في السياق المناسب لاستخدامها في اتخاذ القرارات بدقة وفي الوقت المناسب. 

AŠ‏ البياناثٌ الموضوعً الرئيس لهذا الفصل. ووفقًا لذلك؛ يبدأ الفصل Abg‏ لطبيعة البيانات: 
ماهية البيانات؟ وما هي الأنواع والصور المختلفة التي يمكن أن تظهر بها البيانات؟ وكيف 
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يمكن معالجتها مسبقًا وتجهيزها للتحليلات؟ يتم تخصيصٌ الأجزاء القليلة الأولى من الفصل 
لفهم ومعالجة البيانات بشكلٍ عميق وضروري. كما تقوم thot‏ قليلة بعد ذلك بوَصّف الطرق 
الإحصائية المُستخدّمة لتحضير البيانات كمدخلات لإنتاج كلّ من المقاييس الوصفية والاستدلالية. 
ثم يلي الأجزاء الإحصائية أجزاءٌ تتعلّق بالتقارير وتصوير البيانات. يُعَدَّ التقريرٌ أداةٌ اتصال 
تم إعدادُها لغرض dod‏ وهو تحويل البيانات إلى معلومات ومعرفة وترحيل تلك المعلومات 
بتنسيق قابلٍ للفهم/ الامتيعاب. في الوقت الحالي» يتم الاهتمام أكثر بتوجيه هذه التقارير 
die Baci‏ وغالبًا ما يتمُ ذلك باستخدام الألوان والرسوم البيانية» والتي تبدو بشكلٍ عام 
كلوحة معلومات الغرض منها تحسينٌ محتوى تلك المعلومات. وبالتالي؛ تمّ تخصيصٌ الجزء الأخير 
من الفصل للأقسام الفرعية التي تُعنَى بعرض التصميم والتنفيذ. وكذلك الطريقة المثلى لتصوير 
المعلومات والشرح التفصيلي وعرض لوحات تلك المعلومات. 
؟-١‏ مقال افتتاحي: قيام ال 5111151511 بجذب وإشراك جيل جدید من 
مستخدمي الراديو باستخدام التسويق المبني على البيانات: 

bal sd‏ & الإذاعية الفضائية 5S SiriusXM‏ شركة إذاعية في العاط؛ إذ تُحقق عائدات 
سنوية تبلغ ۲۸ مليار دولارء وتقوم بث مجموعة واسعة من الموسيقى الشعبية والرياضة 
والأخبار والحديث وفقرات الترفيه. وقد بدأت الث في عام ۲١١١‏ بعدد 0٠٠٠١‏ مشتركء إلى أن 
وصلت إلى 18,8 مليون مشترك في عام ,"٠05‏ واليوم لديها ما يقربُ من ۲۹ مليون مشترك 

يرجع الجزءٌ الأكبرٌ من النمؤٌ الذي حققته 4553 SiriusXM‏ حتى الآن إلى الترتيبات الإبداعية 
مع شركات تصنيع السيارات. واليوم تم تمكين ما يقارب من ۷١‏ > من السيارات الجديدة من 
شركة a US gag SiriusXM‏ امتدّ أثرٌ الشركة ما هو أبعد من أجهزة الراديو في الولايات 
المتحدة ألا وهو التواجدٌُ العالمي على الإنترنت والهواتف الذكية وأيضًا التواجد من خلال خدمات 
وقنوات توزيع أخرى مما في ذلك -Dishs JetBlue SONOS‏ 
us‏ الأعمال: 

على الرّغم من هذه النجاحات الرائعة؛ فإنه في غضون السنوات القليلة الماضية ونتيجةٌ 
للتغ برات التى طرأت على كلّ من التركيبة السكانية للعملاء والتقنية وأيضًا حصة المنافسين 
من السوق؛ فقد أَدّى ذلك كله إلى ظهور سلسلة جديدة من تحَدّيات الأعمال والفرص التجارية 
لشركة SSiriusXM‏ ونعرض فيما يلي بعضاً من أبرز تلك التحديات والفرص: 
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- مع زيادة مُعدَّل انتشار السيارات الجديدة في السوق؛ فقد تغيّرت التركيبةٌ السكانية للمشترين؛ 
فقد أصبحت أصغر سن مع دخل تقديري أقل. كيف يكن هنا أن SiriusXM 35,5 (x3‏ 
على هذه التركيبة السكانية الجديدة؟ 

- مع استعمال السيارات الجديدة ومن ثم بيعها كسيارات مستعملة لالكين جُددء كيف يمكن هنا 
SiriusXM J‏ أن تحَدَّد هؤلاء المالكين الجدد. وتحوّلهم إلى عملاء مباشرين؟ 

- تمكّت شركة SiriusXM‏ من تقديم خدماتها عبر كلّ من الأقمار الصناعية والشبكات اللاسلكية؛ 
وذلك بعد استحواذها على أعمال المركبات المترابطة من شركة 48620 - والتي تُعتبر الشركة 
الرائدة في مجال تقنيات المعلومات في سوق السيارات بالولايات المتحدة الأمريكية - فكيف 
يمكنها استغلالٌ هذه الصفقة بنجاح للحصول على مصادرجديدة للدخل؟ 


الحلّ المُقترّح: تحويل الرؤية نحو التسويق المستند إلى البيانات: 
«il SiriusXM 25,5 c gel‏ لواجهة leale O OLAS ola‏ أن تصبح منظمة تسويق عالية 
الأداء ومستندةٌ على البيانات. بدأت الشركة في إجراء هذا التحؤّل من خلال إنشاء ثلاثة مبادئ أساسية: 
- أولًا: التفاعلات الشخصية - وليس التسويق الجماعي - من شأنها أن تحكم اليوم. وسرعان ما 
فهمت الشركة أنه لإجراء ا مزيد من التسويق الشخصي؛ فعليها الاعتماد على التاريخ والتفاعلات 
السابقة. وكذلك على الفهم الشديد لموقع المستهلك من دورة حياة الاشتراك. 
- ثانيًا: للوصول إلى هذا القدر من الفهم؛ ستحتاج تقنية المعلومات وشركاؤها في التقنية الخارجية 
إلى القدرة على تقديم بيانات متكاملة. وتحليلات متقدّمة ومنصات تسويق متكاملة. وأنظمة 
توصيل مُتعدّدة القنوات. 
- 5 قد لا تتمَكّن الشركة من تحقيق أهدافها التجارية دون وجود وجهة نظر متكاملة ومتسقة 
بهاء والأهم من ذلك؛ يجب أن تتحول الجوانب التقنية والتجارية في 5[10050531 إلى شركاء حقيقيين 
dax‏ على نحو أفضل للتحديات التي تواجهها في أن تصبح منظمةًٌ تسويقيةً عالية الأداء ومعتمدةٌ 
على الأفكار المستندة على البيانات للتحدّّث مباشرةً مع المستهلكين بطرق ملائمة بشكلٍ ملحوظ. 
تلك الأفكارٌ ا مبنية على البيانات» على سبيل ال مثال» سثّمكن الشركة من التفريق بين ا مستهلكين 
واخلاك والسائقين والمستمعين وأصحاب الحسابات. كما ستساعدٌ SiriusXM àS,5 jI&8Sl eX‏ 
على فهم تلك المركبات والخدمات الأخرى التي تُشكّل جزءًا من كل أسرة, وأيضًَا صُنِع فرص جديدة 
للمشاركة. بالإضافة إلى ذلك. ومن خلال إنشاء رؤية شاملة وموثوقة بزاوية YT‏ درجة لجميع 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري vv‏ 


الفصل الثاني 


مستهلكيهاء تستطيع 5111055034 ضمان أن تكون جميع الرسائل في جميع الحملات والتفاعلات 
مُصمَّمةً وملائمةً ومتسقةٌ عبر جميع القنوات. والنقطة المهمة أيضًا هي أن يكون التسويقٌ 
الأفضل تصميمًا وفعاليةً هو عادةً الأقل تكلفة. 
التنفيذ: إنشاء ومتابعة المسار المؤدي إلى التسويق عالي الأداء: 
في الوقت الذي قرّرت فيه أن تصبح شركة 23 SiriusXM cal5 sel ille is‏ تعمل مع منصة 
تسويق خارجية لا تمتلك القدرة على دعم طموحات 5151050001؛ فاتخذت الشركة قرارًا مستقبليًا مهما 
يهدف إلى رفع قدراتها التسويقية الداخليةء ومن ثم رسمت بعناية ما يلزم القيامٌ به لتحقيق ذلك بنجاح. 
-١‏ تحسين نظافة البيانات من خلال تحسين إدارة البيانات الرئيسية والحوكمة. وعلى الرغم 
من نفاد صبر الشركة في وضع الأفكار موضع التنفيذ؛ فَإِنَّ نظافة البيانات كانت خطوةٌ أولى 
وضروريةً لإنشاء نافذة موثوقة في سلوك المستهلكين. 
؟- نقل نشاط التحليلات التسويقية إلى داخل الشركة وتوسيع حجم البيانات؛ لرفع كفاءة تلك 
التحليلات وتقديم دعم كاملٍ ومتكامل لها. 
*- تطوير نماذج جديدة للتصنيف والتسجيل لتفعيل قاعدة البيانات, والقضاء على التأخر في 
الاستجابة وتكرار البيانات. 
> توسيع حجم البيانات المتكاملة لتشمل بيانات التسويق والتسجيل؛ والاستفادة من تحليلات قاعدة البيانات. 
5- اعتماد منصة تسويقية لتطوير الحملات. 
-1١‏ وَضْع JS‏ تلك القدرات معًا؛ لتحقيق إدارة العروض في وقتٍ ملائم عبر جميع قنوات التسويق: 
مركز الاتصال» والتليفونات الخلويةء ومواقع الإنترنت» والتطبيقات الجاهزة. 
ól‏ إكمال كلّ تلك الخطوات يعني العثور على شريك التقنية المناسب. فوقع اختيار 
Sirius‏ على تيراداتا؛ إذ شكّلت نقاطٌ قوتها رابطةً قويةٌ بين المشروع والشركة؛ فكانت تيراداتا 
قادرةٌ على القيام بما يلي: 
- دمج مصادر البيانات مع مستودع بيانات متكامل (12۷)» وتحليلات متقدمة» وتطبيقات تسويق قوية. 
- حلّ المشكلات وقت استجابة البيانات. 
- تقليص معنوي في حركة البيانات عبر قواعد بيانات وتطبيقات مُتعدّدة. 
- سلاسة التفاعل مع التطبيقات الجاهزة والوحدات النمطية لجميع مجالات التسويق. 
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- القياس والتنفيذ بمستويات عالية جدًا؛ بهدف تشغيل الحملات والتحليلات ضمن قاعدة البيانات. 
- فتح قنوات اتصال في وقت ملائم مع العملاء. 
- تقديم الذّعم التشغيلي (سواءً عبر السّحابة أو في أماكن العمل). 

وقد مكَّنَتَ شركة تيراداتا شركة 511005104 من التحرّك بسلاسة وبسرعة على امتداد خارطة 
الطريق التي رسمتها لنفسهاء والشركة الآن في خضم عملية تحؤلية مدتها خمس سنوات. وبعد 
تأسيسها لعملية إدارة البيانات القويةء بدأت 51111151 من خلال تنفيذ مستودع بيانات متكاملة 
لهاء والذي مكّن الشركة بسرعة وبطريقة فعّالة في تفعيل رؤيتها الجديدة في جميع أنحاء المنظمة. 

قامت الشركة بعد ذلك بتنفيذ ما يُسمَّى ”مدير التفاعل مع العملاء“ - وهو جزءٌ من برنامج 
تیراداتا tegrated Marketing Cloud‏ - الذي يتيخ التفاعل حواري مع العميل في الوقت 
الملائم؛ وذلك عبر مجموعة كاملة من قنوات الاتصال الرقمية والتقليديةء وأيضًا يسمح بالتعاون 
بين 5111115101 ومركز الرسائل الرقمية ل تيراداتا. 

وستتيح تلك الحزمة من الإمكانيات المجتمعة لشركة /511105]0 التعاملٌ مع الاتصالات 
المباشرة عبر قنوات مُتعددة. كما أن هذا التطؤر سوف يتيحٌ العروض في الوقت الملائم» وكذلك 
الرسائل التسويقية والتوصيات بناءً على السلوك السابق. 

وبالإضافة إلى تبسيطها لكيفية تنفيذ وتحسين الأنشطة التسويقية الصادرة؛ تتحكّم LÀ, SiriusXM‏ 
في عمليات التسويق الداخلية الخاصة بها بالتنسيق مع إدارة الموارد التسويقية, والذي أيضًا يُعَد جزءًا 
من تيراداتا jai lås ga—uswg Integrated Marketing Cloud‏ لشركة 551115106 بتبسيط سير 
العمل» وتحسين الموارد التسويقيةء ورفع الكفاءة من خلال كل قرش من ميزانية التسويق الخاصة بهم. 
النتائج: حَضد الفوائد: 

بينما الشركة تواصل تطورها لتصبح منظمةً تسويقيةً عالية الأداء؛ إذ 534ناذهز5 تستفيدٌ بالفعل 
من إستراتيجيتها المنقّذة بعناية. تعمل كلّ من إحصاءات المستهلك على مستوى الأسرة والرؤية 
الكاملة لإ تراتيجية اللمس التسويقية مع كل مستهلك على تمكين SiriusXM‏ من إنشاء عروض 
أكثر استهداقًا على مستوى كل من الأسرة وا مستهلكين والأجهزة. ومن خلال جعل قدرات البيانات 
والتحليلات التسويقية من ضمن أنشطة الشركة الداخلية» تمكّنت 511051036 من تحقيق الآي: 
- الحصول على نتائج الحملة فورًا تقريبًا بدلا من > أيام؛ مما يؤدي إلى تخفيضات هائلة في Js‏ 

الدوران الزمني للحملات والمحلّلِين الداعمين لها. 
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- الحصول على رؤية دائرية مُغلقة تسمح للمحلّلِين بدعم الحوارات المتعددة المراحل وإجراء 
تعديلات داخل الحملة لزيادة فعاليتها. 
- الحصول على نمذجة وتسجيلٍ فوري؛ لرفع مستوى الذكاء التسويقي وشَّحُذْ عروض الحملات 
والاستجابات بسرعة تلائم أنشطة الشركة التجارية. 
وأخيرًاء عرَّرت تجربة SiriusXM‏ 8,53 أنَّ التسويق العالي الأداء يُعَذَّ مغهوماً يتطور باستمرار. 
كما قامت الشركة بتنفيذ كلّ من العمليات والتقنية التي تمنحها القدرة على النموٌ المستمرٌ والمرن. 
أسئلة على المقالة الافتتاحية: 
-١‏ ماذا تفعل /511005703؟ وفي أيّ نوع من السوق تقوم بأعمالها؟ 
-Y‏ ما التحَدّيات التي واجهتها؟ مع التعليق على كلّ من التقنية والتحَدّيات المتعلقة بالبيانات. 
- ما الحلول القترحة؟ 
©- كيف قامت الشركة بتنفيذ الحلول المقترحة؟ وهل واجهوا أيّ تحديات في أثناء التنفيذ؟ 
-٥‏ ماذا كانت النتائج والفوائد؟ وهل كانت تستحقٌ الجهد/ الاستثمار؟ 


1- هل كنك التفكير في شركات أخرى تواجه تحَدِّياتِ مماثلةء وهكنها الاستفادة من الحلول 
التسويقية المشابهة القائمة على البيانات؟ 


ماذا يمكننا أن نتعلّم من هذه المقالة القصيرة؟ 

في سعيها إلى النجاح ضمن بيئة صناعة تنافسية سريعة التغيّر؛ أدركت ٥دك‏ الحاجة 
إلى بنية تحتية تس ويقية جديدة ومُطورة (والتي تستَندٌ إلى البيانات والتحليلات)؛ وذلك لتوصيل 
القيمة ابمقترحة بفعالية لعملائها الحاليين وامحتملين. وكما هو الحال (Sl à‏ صناعةء أو في الترفيه؛ 
يعتمد النجاحٌ أو البقاء طويلًا على استشعار النزعات ال متغيرة (التفضيلات وعدم التفضيلات) 
بذكاء le‏ ووضع الرّسائل الصحيحة والسياسات اممناسبة معّا؛ بهدف كسب عملاء جُدد مع 
الإبقاء على العملاء الحاليين. الغرض هنا؛ هو إنشاء وإدارة الحملات التسويقية الناجحة التي 
يتردد صداها مع السكان المُسِتَهدَفين من العملاء الذين يعكسون حُزمة من ردود الأفعال وثيقة 
الصّلَة؛ تهدف إلى ضبط وتعديل الرسالة من أجل تحسين المخرجات. في النهاية؛ كان الأمرُ 
يتعلق كليًا بدقة الطريقة التي تم اتباعها في الأنشفطة التجارية» وهي أن تكون سبَّاقًا بشأن 
الطبيعة المتغيرة للعملاء. وأيضًا توفير المنتجات والخدمات المطلوبة في الوقت المناسب للعميل؛ 
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وذلك باستخدام كاملٍ لإستراتيجية التسويق القائمة/ المعتمدة على البيانات. وقد لعب كل من 
تحديد وإنشاء المصادر والوصول إليها وجمعهاء وتكاملها وتنظيفها وتحويلها وتخزينها ومعالجتها 
للبيانات محل الدراسة دورًا مهمًا في نجاح 511115001 في تصميم وتنفيذ إستراتيجية تحليلية 
تسويقية» كما هو الحال في أيّ شركة ناجحة في الوقت الحاضر باس تخدام الذكاء التحليليء بغخض 
النظر عن الصناعة التي يشاركون فيها. 


۲-۲ طبيعة البيانات: 

تُعَدُ البيانات هي العنصر الرئيسي لأيّ مبادرة (ذكاء أعمال)» وعلم البيانات» وتحليلات الأعمال. 
في الواقع؛ يمكن اعتبارٌ البيانات أنها المادة الخام لما تنتجه هذه التقنيات الشائعة لاتخاذ القرار 
من معلومات ورؤية ومعرفة. وبدون بيانات ما كان لأيّ من هذه التقنيات أن تظهر أو تنتشر 
وعلى الرغم من أننا قمنا - وبشكل تقليدي - ببناء نماذج تحليلية باستخدام كلّ من معرفة وخبرة 
الخبراء ببيانات قليلة جدًا أو بدون بيانات على الإطلاقء على كل حال كان ذلك في السابق أمّا الآن 
فقد أصبحت البيانات ركيزةٌ أساسيةً في كلّ ذلك. ونظراً لكون جَمْع وتخزين وإدارة البيانات من 
d tl obs ssl‏ (أيْ: البيانات) ضمن أغلى وأتمن أصول أي منظمة مع إمكانية إنشاء 
رؤية لا تُقدّر بثمن لفهم العملاء وا منافسين وعمليات الأعمال بشكلٍ أفضل. 
يمكن أن تكون البيانات صغيرةً ويمكن أن تكون كبيرةً جدًاء ومن الممكن أن تكون البيانات 
Al.‏ (مُعدَّة بصورة جيدة للتعامل مع أجهزة الحاسب)ء أو يمكن أن تكون غير مهيكلة (على 
سبيل المثال: يتم إنشاءٌ نص يدوي وبالتالي لا يمكن فهمه/ التعامل معه بواسطة أجهزة الحاسب). 
ومن الممكن أن تأت البيانات دائمًا في مجموعاتٍ صغيرة أو تتقولب دفعة واحدة في مجموعة 
أكبر. هناك بعضٌ الخصائص التي تُحدّد الطبيعة المتأصلة للبيانات الآن» والتي نسميها في الغالب 
البيانات الضخمة أو الكبيرة الحجم. وعلى الرغم من أن هذه الخصائص للبيانات تجعلها أكثرٌ 
صعوبةً في المعالجة والاستخدام؛ فإنها تزيدٌ من قيمتها؛ لأنها تجعلها أكثر إثراءً للدراسة بعيدًا 
عن مفاهيمها المألوفة؛ مما يسمح باكتشاف معرفة جديدة ومبتكرة. لقد انقضى Saj‏ الطرق 


Y 


s 


Sources: Quinn, C. (2016). Data-driven marketing at SiriusXM. Teradata Articles & News. at http://bigdata. 
teradata.com/US/Articles-News/Data-Driven-Marketing-At-SiriusXM/(accessed August 2016); Teradata 
customer success story. SiriusXM attracts and engages a new generation of radio consumers. http://assets. 
teradata.com/resourceCenter/downloads/CaseStudies/EB8597.pdf?processed-1. 
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التقليدية لجمع البيانات يدويًا (إمّا عن طريق الاستطلاعات» أو عبر معاملات تجارية مباشرة) 
OLI Gales dors‏ جديدةٌ لجمع البيانات الحديثة التي تستخدم الإنترنت و/أو أجهزة الاستشعار/ 
2 المعتمدة على الشبكات المحوسبة. إن هذه الأنظمة الآلية لجمع البيانات لا تمكّننا فقط 
من جمع مزيد من البيانات؛ ولكن أيضًا ترفع من جودة البيانات, وتؤكّد على سلامتها. ويُوضْح 
الشكل ١-۲‏ سلسلة التحليل النموذجية - بيانات إلى تحليلات إلى معلومات قابلة للتنفيذ. 





عملية الأعمال 




















شكل :١-"‏ بيانات الاستمرارية وال معرفة 

وعلى الرَّعْم من اللكانة الثمينة التي تحتلها البيانات والتي لا يمكن إنكارّها؛ فإنه يجبٌ أن 
تلتزمَ البياناتٌ ببعض القياسات الأساسية ذات الجودة والقابلية للاستخدام. ومن ا معلوم أنه 
ليست كل البيانات مفيدةً لجميع المهام؛ إذ يجبٌ أن تتطابق البيانات مع المهمة المراد استخدام 
تلك البيانات فيها بجانب تغطية التفاصيل الخاصة بتلك المهمة. وبالنسبة لأيّ مهمة Bolas‏ 
يجبٌ أن تتوافق البيانات المتاحة مع متطلبات الجودة والكمية. وبشكل أساسي؛ لا بد من تجهيز 
البيانات للتحليلات. والسؤال هنا ما هو تجهيز البيانات للتحليلات؟ فبالإضافة إلى ضرورة ملاءمتها 
للمشكلة محلّ البحث ومتطلبات الجودة/الكمية؛ يجب أن يكون للبيانات هيكلٌ معينُ يتماثى 
مع الحقول/المتغيرات الرئيسة مع القيم الطبيعية الصحيحة. علاوةً على ذلك؛ يجب أن يكون 
هناك تعريف متفق عليه على مستوى المؤسسة للمتغيرات والموضوعات الشائعة (أحيانًا نُسمّى 
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أيضّا إدارة البيانات الرئيسة)» مثل كيفية تعريف العميل (ما هي خصائص العملاء ا ممستخدّمة 
ië glay‏ شاملٍ Ue‏ يكفي للتحليلات) وفي أي مرحلة من النشاط التجاري يتم الحصولٌ على 
المعلومات المتعلقة بالعميل والتحقّق منها وتخزينها وتحديثها. 
في بعض الأحيان؛ قد يعتمدٌُ تمثيل البيانات على نوع التحليلات الممستخدّمة. عادةً ما 
تتطلّب الخوارزميات التنبؤية بشكلٍ عام وجود ملف ثابت مع متغير GB KJ dai uA‏ 
تجهيز تحليلات البيانات للتنبؤ؛ يعني ضرورةٌ تنسيق مجموعات البيانات على هيئة ملف 
مُسطح مع تجهيزها للدخول في تلك الخوارزميات التنبؤية. كما أنه من الضروري أيضًا مطابقة 
البيانات مع متطلبات برمجيات خوارزمية التنبؤ - على سبيل المثال: تتطلّب خوارزميات 
الشبكة العصبية التمثيل العددي لكل المتغيرات I cux) aliat‏ ا متغيرات الاسمية تحتاج 
إلى تحويلها إلى متغيرات ثنائية رقمية زائفة؛ في حين لا تتطلّب خوارزميات شجرة القرار 
مثل هذا التحويل الرقمي)» والتعامل بسهولة مع مزيج من المتغيرات الاسمية والرقمية. 
غالبًا ما صل مشروعاث التحليلات التي تتجاهل المهامٌ المتعلقة بالبيانات إلى إجاباتِ غير 
ملائمة للمشكلة محل البحثء وقد تؤدي هذه الإجابات التي تم الوصولٌ إليها عن غير قصدء 
والتي قد تبدو جيدة إلى اتخاذ قرارات غير دقيقة وغير ملائمة. ونعرضٌ فيما يلي بعض الخصائص 
(المقاييس) التى تُحدِّد مستوى جاهزية البيانات لإجراء دراسة تحليلية 10610 .2015 ,معاء12 
(Corner. 19975 McQueens‏ 
- موثوقية مصدر البيانات: يشير إلى أصالة وملاءمة وسيط التخزين الذي يتم الحصول على 
البيانات من خلاله - والسؤال هنا هو ”هل لدينا ثقةٌ تامةٌ في مصدر البيانات هذا؟ إذا كان 
ذلك ممكنًا؛ فيجبٌ علينا دائمًا أن نبحث عن المصدر الأصلي/المنشأ الأصلي لتلك البيانات؛ وذلك 
بهدف إزالة/ تقليل احتمال تشويه البيانات وتحويل البيانات الناتجة عن سوه ا معالجة في 
أثناء نقل البيانات من مصدرها إلى وجهتها التالية على مرحلة واحدة أو أكثر؛ إذ إن كل ees‏ 
للبيانات يعطي فرصةً لإسقاط أو إعادة صياغة بنود تلك البيانات عن غير قصد؛ مما يَحِدُ من 
سلامة مجموعة البيانات وربما دقتها الحقيقية. 
- دقة محتوى البيانات: يعني أنَّ البيانات صحيحةٌ ومطابقةٌ بشكل جيد لمشكلة التحليلات - وهنا 
سِؤالٌ آخر ”همل لدينا البيانات الصحيحة للمهمة المطلوبة؟» يجت أن تمثل البياناثٌ اليدف 
الذي تمّ تحديده من خلال المصدر الأصلي للبيانات. فعلى سبيل المثال: يجب أن تكون 
معلوماث التواصل مع العميل المسجّلة في قاعدة البيانات هي نفس ما قاله العميل شخصيًا. 
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هذا وسيتمٌ تناول موضوع دقة البيانات بمزيد من التفصيل في الفقرة التالية من هذا الفصل. 

- إمكانية الوصول إلى البيانات: يعني أن البيانات يمكن الحصول عليها بسهولة ويّسر - وذلك بالإجابة 
عن السؤال التالي ”هل هكننا الوصول بسهولة إلى البيانات عندما نحتاج إليها؟“ قد يكون الوصول 
إلى البيانات خادعًا؛ خاصةً إذا كانت مستودعات البيانات في أكثر من موقع ووسط تخزين وتحتاج 
إلى دمج/ تحويل عند الوصول إليها والحصول عليها. ومع تقلّص دور أنظمة إدارة قواعد البيانات 
العلائقية التقليدية (أو تعايشها مع) جيل جديدٍ من وسائط مستودعات البيانات» مثل: بحيرات 
البيانات» والبنية التحتية 812000 تتزايد في نفس الوقت أهمية/ حساسية الوصول للبيانات. 

- حماية وخصوصية البيانات: يعني أنَّ البيانات متاحةٌ فقط لهؤلاء الأشخاص الذين لديهم 
السُلطة والحاجة إلى الوصول إليها ومَنْع أيّ شخصٍ آخر من ذلك. إن تزايد الرواج في الدرجات 
التعليمية وبرامج شهادات ضمان اللعلومات؛ هو دليلٌ على الحاجة الماسَّة والمتزايدة ملقياس 
جودة البيانات هذا. ينبغي على أيّ منظمة طبية تحتفظ بسجلات صحية JS‏ مريض على 
جِدَة؛ أن يكون لديها أنظمة مُطَبّقَةٌ لا تقوم فقط بحماية البيانات من وصول أشخاص غير 
مُصرّح لهم إليها (والذي يتم تفويضه بموجب قوانين اتحادية» مثل قانون قابلية التأمين الصحي 
وقابلية التأمين [11024]])؛ ولكنها تُحدّد بدقة السماح وإمكانية الوصول إلى سجلات كلّ 
مريض من قبل الأشخاص المُصرّح لهم بذلك (2003 ,ققصصة). 

- ثراء البيانات: يعني أن جميعَ عناصر البيانات المطلوبة مُدرّجِةُ في مجموعة البيانات. في الأساس؛ 
يعني الثراء (أو الشمولية) أن المتغيّرات المتاحة تُصوّر بُعدًا ثريا بما يكفي لدراسة الموضوع 
الأساسي دراسة تحليليةٌ دقيقةً وقيّمةً. ويعني أيضًا أنَّ محتوى المعلومات مكتملٌ (أو شبه 
مكتمل) لبناء نموذج تحليلات تنبؤية و/أو توجيهية. 

- اتساق البيانات: يعني أن البيانات يتم جمعها بدقة وكذلك دمجها/ تركيبها. وتمثل البيانات 
المتسقة معلومات الأبعاد (متغيرات الاهتمام) الواردة من مصادر متفاوتة الاحتمال ولكنها تتعلق 
بنفس الموضوع. فإذا لم يتم دمج/ تكامل البيانات بشكل صحيح؛ فقد تُوجَد بعص المتغيرات 
الخاصة موضوعات مختلفة في سجل واحد - مع وجود مجموعتين من السّجلات المختلفة للمرضىء 
على سبيل الثال: قد يحدث ذلك في أثناء دمج سجلات بيانات نتائج الفحص السكانية والمرضية. 

- توقيت البيانات: يعني أنَّ البيانات يجب أن يتمّ تحديثها (أو تكون حديثةٌ/ جديدةً كما يجب أن 
تكون) لنموذج التحليلات المعطى. كما يعني أن البيانات يتم تسجيلها في وقت الحدث أو الملاحظة 
أو بالقرب منه؛ بحيث يتمٌ مَنْعَ التحريف المتعلق بالوقت للبيانات (التذكر والتشفير غير الصحيحين). 
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ونظرًا لأن التحليلات الدقيقة تعتمد على بيانات دقيقة وفي الوقت المناسب؟؛ فإن السّمة الأساسية 
للبيانات الجاهزة للتحليلات هي توقيت إنشاء عناصر البيانات والوصول إليها. 

- مستوى تفصيل البيانات: يتطلّب ذلك أن يتم تعريف المتغيرات وقيم البيانات على أدنى 
مستوى (أو منخفض بقدر الإمكان) من التفاصيل للاستخدام المطلوب للبيانات. فإذا تمّ 
تجميعٌ البيانات؛ فقد لا تحتوي على مستوى التفاصيل اللازمة لخوارزمية التحليلات بغرض 
تعلّم طريقة تمييز سجلات/ حالات مختلفة بعضها عن بعض. على سبيل المثال: وفي ib lb)‏ 
يتحتم تقريبٌ القيم العددية للنتائج المعملية إلى الخانة العشرية المناسبة للتفسير الهادف 
لنتائج الاختبار والاستخدام السليم لتلك القيم داخل خوارزمية التحليلات. وبا مثلء في مجموعة 
البيانات المتعلقة بالتوزيع YEI‏ ينبغي تعريف عناص البيانات على مستوّى ملائم لتحديد 
الفروق في نتائج الرعاية بين مختلف المجموعات السكانية الفرعية. شي واحدٌ يجب علينا 
تذكره هنا؛ هو أن البيانات المجمّعة لا يمكن تقسيمها (دون الوصول إلى المصدر الأصلي)ء ولكن 
يمكن تجميعها بسهولة من تمثيلها الدقيق. 

- صلاحية البيانات: هو المصطلحٌ المُستخدّم لوصف التطابق/ عدم تطابق بين قيم البيانات 
الفعلية والمتوقعة بلتغير ejas Lo‏ من تعريف البيانات؛ يجب تحديدٌ القيم أو نطاق القيم 
المقبولة لكل عنصر بيانات. على سبيل المثال: يتضمّن تعريف البيانات الصحيح المرتبط بنوع 
الجنسٍ ثلاث قيم: ذكرء وأنثى» وغير معروف. 

- ملاءمة البيانات: يعني أنَّ المتغيرات في مجموعة البيانات كلها ذات صلة بالدراسة التي تتم. 
AÉ Yo‏ العلاقة مقياسًا ثناقي التفرُع (كون المتغير مرتبطاً بالدراسة أم لا)» بل يكون لديها 
مجموعة من الروابط من الأقل صلة إلى الأكثر أهميةً. واستنادًا إلى خوارزميات التحليلات 
المُستخدّمةء قد يختار الدارس فقط تضمين ابمعلومات الأكثر صلة (أيّ: ا متغيرات) أو إذا كانت 
الخوارزمية قادرة على تصنيفها؛ فقد يختارٌ تضمين جميع المتغيرات ذات الصّلة بغض النظر عن 
مستوى ارتباطها. هناك أمرّ مهم يجب على دراسات التحليلات تجّبه ألا وهو تضمين بيانات 
غير ملائمة تمامًا في بناء النموذج؛ فقد يؤدي ذلك إلى تلويث المعلومات الخاصة بالخوارزمية؛ 
مما يؤدي إلى نتائج غير دقيقة ومُضْلّلة. 

وعلى الرغم من أنَّ هذه المقاييس قد تكون الأكثر شيوعًَاء ogo GE‏ البيانات الحقيقية 
والاستعداد الممتاز للتحليلات لنطاق تطبيق معين؛ سيتطلبان مستويات مختلفة من التركيز على 
هذه الأبعاد المترية» وربما إضافة المزيد من التفاصيل المّحدّدة لهذه المجموعة. وسوف نتناول 
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في الفصل التالي zub‏ البيانات بمزيدٍ من التفاصيل من منظورٍ تصنيفي لسرد أنواع البيانات 
المختلفة وتحديدها من حيث صلتها بمشاريع الت التحليلات ايلختلفة. 


أسئلة مراجعة على القسم ۲-۲: 
-١‏ كيف تصف أهمية البيانات في التحليلات؟ وهل مُكننا التفكيرٌ في التحليلات بدون بيانات؟ 
۲- بالنظر إلى التعريف الجديد والواسع لتحليلات الأعمالء ما هي ادخلات وا مخرجات الرئيسية 
لاستمرار التحليلات؟ 
۴- من أين تأت بيانات تحليلات النشاط التجاري؟ 
-٤‏ في رأيك؛ ما هم ثلاثة تحديات متعلَقة بالبيانات؛ للوصول إلى تحليلاتٍ أفضل؟ 
-٥‏ ما امقاييس الأكثر شيوعًا التي تعمل على تجهيز البيانات للتحليلات؟ 
۳-۲ تصنيف مُبِسَط للبيانات: 
تشير البيانات (لا سيما في صيغتها الفردية) إلى مجموعة من الحقائق التي يتم الحصول عليها 
عادةً كنتيجة للتجارب أو المشاهدات أو المعاملات أو الخبرات. وقد تتكوّن البيانات من الأرقام 
والحروف والكلمات والصور والتسجيلات الصوتية وما CUS JI‏ كقياسات لمجموعة من المتغيرات 
(خصائص الموضوع أو الحدث محل الدراسة). فغالبًا ما يُنظر إلى البيانات على أنها أدنى مستوى من 
التجريد (الغموض) يتم استخلاص معلومات منه. ومن ثمّ معرفة. أما في أعلى مستوى من التجريد؛ 
فيمكن تصنيف البيانات على أنها منظمةٌ وغير منظمة (أو شبه مهيكلة). تتكون البيانات غير/ شبه 
المهيكلة من أي مزيج من المحتوى النضّي والصور والصوت ومحتوى الويب. وستتمٌ تغطية البيانات 
غير/ شبه المهيكلة بمزيدٍ من التفصيل في فصل تعدين النص وتعدين الويب. أمّا البيانات المهيكلة؛ 
فهي تلك التي تستخدمها خوارزميات التنقيب في البيانات» ويمكن تصنيفها على أنها فئويةٌ أو 
رقمية. ويمكن تقسيمٌ البيانات الفئوية إلى بيانات اسمية أو ترتيبية» في حين تقسّم البيانات الرقمية 
إلى فواصل زمنية أو نِسّب. يُوضّح الشكل 7-١‏ تصنيفاً بسيطاً للبيانات. 
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شکل ۲-۲: تصنیف بسیط للبیانات 

- بيانات É dga‏ علامات الفئات المتعدّدة المُستَخدّمة لتقسيم متغير إلى مجموعات مُحدَّدة. 
yis‏ أمثلة المتغيرات الفئوية كالعرق والجنس والفئة العمرية والمستوى التعليمي. وبالرغم 
من أن المتغيرين الأخيرين قد يتم LÁ logad SAI‏ بطريقة عددية باستخدام قيّم دقيقة للعمر 
وأعلى درجة مكتملة؛ فإنه غالبًا ما يكون أكثرّ إفادةً لتصنيف مثل هذه المتغيرات إلى عدد 
صغير نسبيًا من الطبقات المرتبة. وقد يُطلّق على البيانات الفئوية أيضًَا بيانات منفصلة؛ مما 
يعني أنها تمثل عددًا محدودًا من القيم دون اتصال بينها. وحتى إن كانت القيم المُستخدّمة 
للمتغيرات الفئوية (أو المنفصلة) هي قيم رقمية؛ فإنَّ هذه الأرقام ليست أكثرَ من رموز ولا 
eto‏ إلى إمكانية حساب قِيم كسرية. : 

- بيانات اسمية: تحتوي على قياسات الرموز البسيطة المُخصّصة للأشياء كتسميات؛ ولكنها لا 
تُعتبّر قياسات. فعلى سبيل المثال: يمكن تصنيف المتغير (الحالة الاجتماعية) بشكل عام إلى )١(‏ 
أعزب» (۲) متزوج» (©) مطلق. Jig GSE LS‏ البيانات الاسمية ذات القيم الثنائية بقيمتين 
محتملتين (على سبيل المثال: نعم/ لاه أو صواب/ خطأء أو جيد/ سيء» أو ما إلى ذلك)» أو ذات 
القيم المتعدة بثلاث قيم محتملة أو أكثر (مثل: بني/ أخضر/ أزرقء أو أبيض/ أسود/ لاتيني/ 
آسيوي» أو أعزب/ متزوج/ مطلقء أو ما إلى ذلك). 

- البيانات الترقيبية: تحتوي على رموز مُخصّصة للأشياء أو الأحداث كتسمياتء وفي نفس الوقت 
تُعبّر أيضًا عن رتبة الترتيب فيما بينهم. فعلى سبيل المثال: يمكن تصنيف المتغير (درجة 
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الائتمان) بشكل عام إلى )١(‏ منخفضة» أو gf åh ugio (Y)‏ (*) مرتفعة. كما يمكن وَضْع 
العلاقات المرتبة الممائلة في متغيرات, مثل: الفئة العمرية (بمعنى: طفلء شاب متوسط 
العمرء مسن). والمستوى التعليمي (بمعنى: المدرسة الثانوية:» الكليةء الدراسات العليا). 
- البيانات الرقمية: تمثل القيمُ العددية لمتغيراتٍ مُحدَّدة. وتشمل أمثلة المتغيرات ذات القيمة العددية 
السّنء وعدد الأطفالء ومجموع دخل الأسرة (بالدولار الأمريي)» ومسافة السفر (بالأميال)» ودرجة 
الحرارة (يمقياس فهرنهايت). كما يمكن أن تكون القيم العددية للمتغير عددًا صحيحًا (بلا كسور) أو 
حقيقية (تشمل الصحيحة بالإضافة إلى الكسور). وقد تُسمّى البياناتٌ الرقمية أيضَّا بيانات مستمرة؛ 
مما يعني أنَّ المتغير يحتوي على مقادير متواصلة على مقياس auy le adah‏ بإدخال قيم مؤقتة. 
فبخلاف المتغير المنفصل الذي يمثل بيانات محدودة وقابلة للعد. يمثل المتغير المستمر قياسات قابلة 
للتطويرء ومن الممكن أن تحتوي البيانات على عدد لا نهائي من القيّم الكسرية. 
- بيانات فترة: هي مُتغيرات 9$ قياسها على مقاييس الفواصل الزّمنية. هناك مثال شائعٌ لقيا 
الفواصل الزمنية؛ هو درجة الحرارة المئوية. في هذا المقياس المُحدَّد تكون وحدة القياس ٠٠١ /١‏ 
من الفرق بين درجة حرارة الانصهار ودرجة حرارة الماء المغلي في الضغط الجوي؛ ها يعني عدم 
وجود قيمة صفرية مطلقة. 
- بيانات نسبية: وتشمل المتغيرات الشائعة للقياس والموجودة في علوم الفيزياء والهندسة. ود 
js‏ من المجموعة والطول والوقت وزاوية الطائرة Malls‏ والضّحنة الكهربائية أمثلةٌ على 
القياسات الفيزيائية التي هي مقاييس النّسَب. وتستمدٌ هذا النوع من المقاييس اسمّه من 
حقيقة أنَّ القياس هو تقديرٌ النسبة بين حجم الكمية المستمرة وحجم وحدة من نفس النوع. 
وبشكل غير رسمي؛ تُعَذُ السّمة المميزة لمقياس النسبة هي وجودٌُ خانة صفرية القيمة وغير 
عشوائية. فعلى سبيل اللثال: فإنَّ مقياس درجة الحرارة كلفن له نقطة صفر غير عشوائية من 
الصفر المطلق, والتي تساوي (-70/,10) درجة مئوية. SS‏ نقطة الصفر هذه غير عشوائية؛ 
لأن الجسيمات التي تشكل المادة عند هذه الدرجة لها طاقةٌ حركية صفرية. 
يجب تحويل أنواع البيانات الأخرى» كبيانات النصوص والحيّز والصور والفيديو والصوت» 
إلى شكلٍ من أشكال التمثيلٍ الفئوي أو الرقمي قبل أن تتمّ معالجثها بواسطة طرق التحليل 
(خوارزميات التنقيب في (Delen, 2015 OLLI‏ كما يمكن أيضًا تصنيف البيانات إلى بيانات 
ثابتة أو حركية (أيّ: سلاسل مؤقتة أو زمنية). o uso Ja‏ التحليلات التنبؤية (مثل: التنقيب 
في البيانات) وخوارزميات تعلم الآلة؛ طرقاً انتقائية للغاية لنوع البيانات التي مكنها التعامل معها. 
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وقد يؤدي الاعتمادٌ على أنواع بيانات غير متوافقة مع طرق التحليلات إلى الحصول على نماذج 
غير صحيحة أو (في أغلب A (Obo‏ عملية تطوير النموذج. فعلى سبيل المثال: تحتاج بعضٌش 
طرق التنقيب في البيانات أن يتم تمثيلٌ جميع المتغيرات (سواء مدخلات أو مخرجات) كمتغيرات 
ذات قيمة رقمية (مثل: الشبكات العصبيةء آلة ا متجهات الداعمة, الانحدار اللوجستي). ويتمُ 
تحويلٌ المتغيرات الاسمية أو الترتيبية إلى تمثيلات رقمية باستخدام أحد أنواع المتغيرات الزائفة من 
١‏ إلى ن (فمثلاء يمكن تحويلٌ متغير فئويّ له ثلاث قيم مختلفة إلى ثلاثة متغيرات زائفة ذات قيم 
ثنائية ٠‏ أو .)١‏ ولأن هذه العملية قد تزيدٌ من عدد امتغيرات؛ فلا بد من الحَذر بشأن تأثير هذه 
التمثيلات؛ خاصةً فيما يتعلق بالمتغيرات الفئوية التي تحتوي على أعداد كبيرة من القيم الفريدة. 
وبالمثل؛ تحتاج بعض طرق التحليلات التنبؤية مثل 123 (خوارزمية شجرة القرارات الكلاسيكية) 
والمجموعات الخام (خوارزمية قاعدة الاستقراء الجديدة نسبيًا)» إلى تمثيلٍ جميع المتغيرات كمتغيرات 
قطعية القيمة. وقد Callas‏ الإصداراث القدهة من هذه الطرق من المستخدم أن يقوم بفصل 
وتمثيل المتغيّرات الرقمية في مجموعات فئوية قبل أن تتمّ معالجتها بواسطة الخوارزمية. والخبر 
السّار؛ Ol sa‏ معظم تطبيقات هذه الخوارزميات في أدوات البرامج المتاحة على نطاق واسع تقبل 
مزيجًا من المتغيرات الرقمية والاسمية وتقوم داخليًا بإجراء التحويلات اللازمة قبل معالجة البيانات. 
تظهر البياناث في العديد من أنواع المتغيرات المختلفة والرسومات البيانية. تتحسّن أدواث تحليل 
الأعمال باستمرار في قدرتها على مساعدة علماء البيانات في المهمة الشاقة المتمثلة في تحويل وتمثيل 
البيانات؛ بحيث بمكن تنفيذُ متطلبات البيانات الخاصة بنماذج وخوارزميات تنبؤية مُحدّدة بشكل 
óig guruo‏ الحالة العملية ١-۲‏ سيناريو العمل الذي قامت فيه شركة الأبحاث والتطوير الخاصة 
بالأجهزة الطبية الغنية بالبيانات بتبسيط أنشطة التحليلات لديها؛ بهدف الوصول بسهولة إلى ÍS‏ 
من البيانات والتحليلات التي تحتاجها لمواصلة أعمال الابتكار والجودة بها على أعلى المستويات. 
حالة عملية 1-9 
شركة أجهزة طبية تضمّن جودة المنتج مع توفير امال 
تتط ؤر بعص التقنيات بشكلٍ أسرع منها في المجال الطبي؛ لذا فقد يغيّر امتلاك 
برامج التحليلات المتقدّمة المناسبة من قواعد اللعبة. وَيُعَذُ معملٌ الأجهزة رائدًا في 
تطوير وتصنيع وتوزيع الأجهزة الطبية والتقنيات المتعلقة بهاء بما في ذلك التقنية التي 
أحدثت è fs‏ اختبارات الدم الكامل والتخثر. وللمساعدة في ضمان استمرار نمؤّها 
ونجاحهاء تعتمدٌ الشركة على تحليلات البيانات ودع ]5]25 2611. 
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المشكلة: 


وباعتبارها شركةٌ رائدةً في سوق أدوات التشخيص الخاصة بالرعاية الحرجة والتخثر؛ 
لذا يجب أن يستفيد معملٌ الأجهزة من التقنيات السريعة التطور مع الحفاظ على JS‏ 
من الجودة والكفاءة في تطوير وتصنيع وتوزيع منتجاته. وعلى وجه الخصوص؛ فقد 
مكنّت الشركة علماءها ومهندسيها في مجالي البحث والتطوير من سهولة الوصول إلى 
ثروة غزيرة من البيانات ومن ثم تحليلهاء بجانب الكفاءة في مراقبة عمليات التصنيع 
وسلاسل التوريد. 

يوضّح جون ies‏ محلل الأعمال ,لعمل الأجهزة: «مثل العديد من الشركات. كنا أغنياء 
بالبيانات؛ ولكن فقراء في التحليل؛ فلم يعد من الممكن أن ينجح مُحللو البحث والتطوير في 
الوصول إلى تقنية المعلومات في كلّ مرة يحتاجون فيه ا إلى الوصول إلى بيانات الاختبارء ومن 
ثم إجراء تحليلات ممرة واحدة في ا٤111‏ بل يجبٌ أن يكون لديهم القدرة على الوصول إلى 
البيانات بسرعة وإجراء تحليلات مُعقّدة بشكلٍ متسق ودقيق». 

كان تنفيدٌ تحليلات متطوّرة لمعمل الأجهزة أمرًا حسام وذلك بسبب حجم وتعقيد 
منتجاتها. فعلى سبيل المثال: تقوم الشركة ÍS‏ عام بتصنيع مئات الآلاف من اللفائف 
التي تحتوي على بطاقة بها مجموعة متنوعة من أجهزة الاستشعار التي تقوم بقياس 
الإشارات الكهربائية للدم في أثناء عملية الاختبار. 

يقول يونج: ”تتأثر أجهزة الاستشعار هذه بعوامل عديدة جدًاء من التغيرات 
البيئية» مثل: الحرارة والرطوبة إلى عدم تناسق اللواد الواردة؛ لذلك فإننا نقوم وبشكلٍ 
متواصلٍ بمراقبة أدائها. إننا نجمحٌ ملايين السجلات من البيانات» والتي يتم تخزين 
معظمها في قواعد بيانات :©501.56,0. وكنا في حاجة إلى منصة تحليلية تمكّن فرق 
البحث والتطوير التابعة لنا من الوصول بسرعة إلى تلك البيانات والتدخُل السريع لحل 
csl‏ مشكلات قد تحدث. وأيصًا؛ ونظرًا لوجود العديد من العوامل في اللعبة؛ فقد احتجنا 
إلى برنامج تلقائي يمكنه مراقبة بيانات الاختبار بذكاء وتنبيهنا إلى المشكلات الطارئة 
بشكلٍ فوري". 

الحل: 

Jana iso‏ الأجهزة بالبحث عن حل تحليليٌ لتلبية احتياجاته. فقامت الشركة سريعاً 
بإزالة معظم الأدوات من السوق؛ لأنها فشلت في تقديم الوظائف الإحصائية ومستوى الثقة 
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المطلوبة لبيئة الرعاية الصحية. مع ترك اثنين من المنافسين: الأول 5)8]19]12, وحل تحليلي 
آخر وهو ه]535ة]5 2611. بالنسبة لمعمل الأجهزة. كان الفائز الواضح هو 5]2]15862. 

يقول يونغ: Sys DLS Statistica Las OS»‏ فمع 1151 تمكّنا من إنشاء 
مجموعة واسعة من تشكيلات التحليل العالية المستوى للبيانات الخاصة بنا؛ وذلك 
ليستخدمها الممحلّلون على نطاق المؤسسة بأكملها. والآن؛ عندما يريدون فهم أشياء 
مُحدّدة؛ يمكنهم ببساطة إجراءٌ تحليلٍ cla‏ من هذا المتجر المركزي بدلا من الاضطرار 
إلى طلب تقنية المعلومات للوصول إلى البيانات أو تذكر كيفية إجراء اختبارٍ محين». 

إضافةً إلى ذلك؛ كانت da a Statistica‏ بكثير في الاستخدام والنشر من حلول 
التحليلات القدهة. يدون يونج في sb salo‏ والإبقاء على حلولٍ تحليلية أخرى, 
تحتاج إلى معرفة برمجة حلول التحليلات؛ ولكن مع 4ءناءذاه)؟ مكنني الاتصالٌ بالبيانات 
الخاصة بناء وتحليلها ونشرها في غضون ساعة - على الرغم من أنني لست مبرمجًا عظيمًا». 

وأخيرً؛ بالإضافة إلى وظائفها المتقدّمة وسهولة استخدامها؛ فقد قدّمت شركة 
11 دعمًا عالميًا وخدمةً سعريةً A alie‏ يقول يونغ: «إِنَّ الأشخاصّ الذين 
ساعدونا في تطبيق نظام 51315618 كانوا ببساطة رائعين وكان السعرٌ أقلٌ بكثير مما 
يتيحه أي حل آخر للتحليلات». 

النتائج: 

ds المشروع القدرة على الوصول الشّهل إلى‎ ios أصبح الآن لدى‎ ‘Statistica za 
من الابتكار والجودة في معمل‎ US من البيانات والتحليلات التي يحتاجونها لمواصلة‎ 
الأجهزة. في الواقع؛ فإِنّ التحليلات السريعة والفعّالة وكذلك التحذيراثٌ الآلية من‎ 
للشركة مئات الآلاف من الدولارات.‎ g5 Statistica جانب‎ 

يقول يونج: ”في أثناء تصنيع خرطوشة الجبر؛ نتعرّض من حين لآخر لبعض 
امشكلات» مثل عدم الدقة في التركيب الكيميائي الذي مر على أحد أجهزة الاستشعار 
إن تخريد دفعة واحدة من البطاقات قد يكنّفنا مئات الآلاف من الدولارات. غير أَنَّ 
12 تساعدنا على اكتشاف الخطأ بسرعة وإصلاحه مما يُجِنْبنا تلك التكاليف. 
فمثلً؛ يمكننا تزويجٌ بيانات الاختبار مع بيانات سجل تاريخ الأجهزة الإلكترونية من بيئة 
585 الخاصة بنا وإجراء كلّ أنواع الارتباطات لتحديد أي التغيّرات يؤدي إلى «AS ico‏ 
من هذه التغيرات مثلًا التغيُّرات في درجة الحرارة والرطوبة. 
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X. s‏ عملياتٌ التحقق من الجودة اليدوية ذات قيمة كبيرة بكلّ تأكيد؛ ولكن تدير 
egio sgam ISLA Statistica‏ من التحليلات للشركة. بشكلٍ يضمن عدم حدوث 
أيّ خطأ واكتشاف المشكلات بسرعة. يقول يونغ: «من المقرّر إجراء العديد من عمليات 
التحليل بشكلٍ 3555( لفحص أشياء مختلفة؛ فإذا تمّ اكتشافُ مشكلة؛ فسيقوم النظام 
تلقائيًا بتنبيه المسؤولين عبر البريد الإلكتروني أو تسجيل المخالفات بقاعدة البيانات». 

so lo ule dazás Statistica بعض المزايا الرئيسية لتحليلات البيانات المتقدّمة مح‎ oj 

- الالتزام بالتنظيم: بالإضافة إلى توفير أموالٍ معامل أجهزة القياس؛ تضمّن 
hjit S Statistica‏ عمليات الشركة بقوانين إدارة الأغذية والأدوية (81(4) فيما 
يتعلّق بالجودة والاتساق. يُوضّح يونج ما يلي: «لأننا نقوم بتصنيع الأجهزة الطبية؛ فإننا 
نخضعٌ لنظام إدارة ۴4ء تساعدنا ه15]1)ة]5 على إجراء عمليات التحقق الإحصائية 
التي تتطلبها إدارة 824 - فعلى سبيل المثال: يمكننا بسهولة إثباتٌ أنَّ مجموعتين من 
المنتجات المصنوعة باستخدام مواد كيميائية مختلفة هي نفسها إحصائيًا». 

- ضهان الاتساق: |6 Statistica à 84 5l J los SLS‏ والتي يمكن 
js (9l eL] d gll ul‏ £5 2423 التناسق والجودة في معمل الأجهزة. يقول 
يونج: ”وعند تحليلٍ البيانات يمكنك Joao‏ على نتائج مختلفة تبعًا للطريقة التي 
تستخدمها في التحليل. فمثلًا قد يستخدم علماءٌ مختلفون أنظمةٌ مختلفةٌ على البيانات, 
أو لا يقومون بتلخيصها إطلافًّاء عندئذ فسيحصلون جميعًا على نتائج مختلفة, أمّا مع 
15118 فنستطيع أن نضمّن أنَّ جميع العلماء في جميع مراحل المشروع يقومون 
بإجراء التحليلات بنفس الطريقةء وبهذا نحصل على نتائج متناسقة.» 

- مراقبة سلسلة التوريد: لا يقوم معمل الأجهزة بتصنيع البطاقة» وبها أجهزة 
استشعار فحسب؛ بل تقوم بتصنيع الجهاز الطبي بالكاملء وبالتالي فهو يعتمدٌ على 
المورّدين لإمداده بالأجزاء المطلوبة. ولمزيد من ضمان الجودة, يُخطّط الشركة لتوسيع 
نطاق تعاملها مع 562156162 لمراقبة سلسلة التوريد. 

- توفير الوقت: بالإضافة إلى توفير الأموال ورفع مستوى الالتزام بالتنظيم لمعمل 
الأجهزةء تعمل شركة 5]615]12 أيضًَا على توفير الوقت الثمين لمهندسي وعلماء الشركة؛ 
مما يمكّنهم من التركيز بش كل أكبر على الابتكار والحَدّ من الروتينيات. يدون يونج في 
ملاحظاته: «توفر التنبيهات الاستباقية من 562115162 للمهندسين الكثيرَ من الوقت؟ 
فهم ليسوا بحاجة لتذكٌر فحص العوامل المختلفة طوال الوقتء مثل: نقص الجلوكوز؛ 
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فهذا اختبارٌ واحدٌ؛ لكنه يسغرق نصف اليوم. أما في ظل مراقبة 5]8]15]162 لبيانات 
الاختبار لدينا؛ فبإمكان المهندسين التركيرٌ على أمور أخرى؛ لعلمهم بأنه سيصلهم بريد 
إلكتروني إذا أَذّى نقصٌ الجلوكوز لأيّ مشكلة». 

الاحتمالات المستقبلية: 

إن معمل أجهزة القياس مُتحمّس جدًا للفرص Ce Rio il‏ من خلال الرؤية التي 
يوفرها برنامجٌ التحليلات المتقدّمة من 5]]15]102 في مخازن البيانات الخاصة به. يقول 
يونج: ”باستخدام ‘Statistica‏ كنك اکتشاف جميع أنواع الأفكار المتعلقة ببياناتك. والتي 
قد لا تتمّكّن من العثور عليها. فقد يكون أمامك مكاسبٌ مادية خفية؛ لكنك لا تراها لأنك 
لم تحلل بياناتك كما ينبغي. فباستخدام تلك الأداة. اكتشفنا بعض الآشياء المثيرة للاهتمام 
في بياناتنا والتي وفرت لنا مبلعًا كبيرًا جدًا من المال ونتطلّع إلى إيجاد المزيد منها». 

أسئلة للمناقشة: 

-١‏ ماهي التحدَّيات الرئيسية لشركة الأجهزة الطبية؟ وهل تم قيادة السوق 
أو التقنية؟ اشرح. 

-Y‏ ما هو الحل المقترح؟ 


Ls -Y‏ هي النتائج التي S‏ التوصل إليها؟ وما رأيك في العائد الحقيقي للاستثمار (801)؟ 
Source: Dell customer case study. Medical device company ensures product quality‏ 
while saving hundreds of thousands of dollars. https://software.dell.com/documents/‏ 
instrumentation-laboratory-medical-device-companyensures-product-quality-‏ 
whilesaving-hundreds-ofthousands-of-dollars-case-study-80048.pdf (accessed‏ 
August 2016). Used by Permission from Dell.‏ 


أستلة مراجعة على القسم ۴-۲: 
-١‏ ما هي البيانات؟ وكيف تختلف البيانات عن المعلومات والمعرفة؟ 


؟- ما هي SLA‏ الرئيسية للبيانات؟ ما هي أنواعٌ البيانات التي يمكن استخدامها في ذكاء الأعمال 


wr 


والتحليلات؟ 


$y نفس تمثيل البيانات لجميع نماذج التحليلات؟ اذا أو بلاذا‎ pascal Use Ja -Y 


-٤‏ ما هو تمثيل بيانات -١‏ من - ن؟ لماذا وأين يتم استخدامها في التحليلات؟ 
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٤-٣۲‏ فن وعلم معالجة البيانات: 

عادةً ما تكون البيانات في شكلها الأصلي (أَيْ: بيانات العالم الحقيقي) ليست جاهزةٌ للاستخدام 
في مهام التحليلات. فغالبًا ما تكون كثيرة الأخطاء ومنحرفةً ومُعقدةً للغاية. وغير دقيقة؛ لذا فإنه 
من الضروري القيامٌ هنا بعملية شاقة ومُكلّفة من ناحية الوقت (تُسمّى عملية المعالجة المسبقة 
للبيانات) بغرض تحويل بيانات العالم الحقيقي إلى شكل جيد الدقة لاستخدامها في خوارزميات 
التحليلات )2006 (Kotsiantis, Kanellopoulos, & Pintelas,‏ ويقرٌ العديدٌُ من مُحترفي 
التحليلات أنَّ الوقت المُستَغْرّق في معالجة البيانات (والذي قد يكون أقلّ مراحل العملية امتاعًا) 
يكون أطول بكثير من الوقت المُستَغْرّق في بقية مهام التحليلات (متعة بناء نموذج التحليلات 
وتقييمها). ويوضّح الشكل 7-١‏ الخطوات الرئيسية في محاولة معالجة البيانات. 

في المرحلة الأولى من المعالجة المُسبّقة للبيانات؛ يتخ جمعٌ البيانات المتعلّقة بالدراسة من 
المصادر المحدّدة gig eUI‏ تحديدٌ السجلات والمتغيرات الضرورية (استنادًا على الفهم العميق 
للبيانات» مع تصفية المعلومات غير الضرورية). كما يتم تكامل/ دَمْج الس جلات الواردة من 
بيانات متعددة المصادر (وأيضًا باستخدام الفهم العميق للبيانات ُمكن التعامل مع المرادفات 
والمتضادات المتشابهة بشكلٍ صحيح). 

في المرحلة الثانية من معالجة البيانات؛ يتم تنظيف البيانات (تُعرَف هذه الخطوة أيضاً 
ب تنقية البيانات). فعادةً ما تكون البياناتُ في شكلها الأصلي/ الخام/ الحقيقي كثيرة الأخطاء 
.)7٠١ «35, 21 Stolfo, Kim; 19985 Hernández)‏ في هذه الخطوة؛ يتم تحديدٌ القيم في 
مجموعة البيانات والتعامل معها. في بعض الحالات؛ تُشكَل القيمُ المفقودة شذوذاً في مجموعة 
البياناتء وفي هذه الحالة لابدٌ من حصرها (بِوَضْع قيم محتملة لها) أو تجاهلهاء وفي حالات 
أخرى؛ تكون القيمٌ المفقودة جزءً! طبيعيًا من مجموعة البيانات (فمثلاء غالبًا ما يتم ترك خانة 
دخل الأسرة بدون إجابة من أصحاب الدخل المرتفع). في هذه الخطوة؛ يجب أيضًا على المحلل 
تحديدُ القيم الصاخبة في البيانات (أيْ: القيم المتطرفة) ومن ثم تسهيلها. بالإضافة إلى ذلك؛ يجب 
التعاملٌ مع حالات عدم الاتساق في البيانات (كوجود قيم غير عادية ضمن متغير) باستخدام 
معرفة مجال الدراسة و/ أو رأي الخبير. 

في المرحلة الثالثة من معالجة البيانات؛ يتم doses‏ البيانات من أجل معالجة أفضل. فعلى 
سبيل المثال: في العديدٍ من الحالات» يتم توزيعٌ البيانات توزيعًا طبيعيًا بين حَدَّين (أدنى وأقصى) 
مُحَدّدِين؛ وذلك لجميع المتغيّرات؛ بهدف تخفيف التحيّز المحتمل nid‏ واحدٍ (به o‏ عددية 
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كبيرة. مثل دخل الأسرة) يحتوي على متغيرات أخرى (لها قيمٌ أصغرء مثل عدد مَنْ يعول أو 
سنوات الخدم ة) والتي قد تكون أكثر أهميةً. وهناك تحويلٌ آخر يتم إجراؤه وهو التفريد و/ 
أو التجميع. وفي بعض الحالات؛ يتم تحويلٌ المتغيرات الرقمية إلى قيم فئوية (مثل: منخفض - 
متوسط - مرتفع)» وفي حالاتٍ أخرى؛ يتم تقليلٌ النطاق الفريد لقيمة المتغير الاسمي إلى مجموعة 
أصغر باستخدام مفهوم التسلسل الهرمي (على سبيل المثال: عند استخدام حالات فردية تحتوي 
على ٠‏ قيمة مختلفة قد يستخدمٌ المحلّل عدَّة مناطق للتغير يُظهر الموقع)؛ وذلك للحصول على 
مجموعة بيانات تكون أكثر قابليةٌ للتعامل مع الحاسب. ومع ذلك؛ ففي حالاتٍ أخرىء قد يختار 
المحلّل إنشاء متغيرات جديدة تعتمدٌُ على المتغيرات الحالية لزيادة معنوية المعلومات الموجودة 
بمجموعة المتغيرات في حزمة البيانات. 





60 dM 
«o gem 
”  تاراركتلا إزالة‎ 














شکل ۳-۲: خطوات معالجة البيانات 
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فعلى سبيل المثال: في مجموعة البيانات الخاصة بزراعة الأعضاءء قد يختارٌ المحلل استخداءً 
متغير مفرد m‏ حالة الدم Ía (1 = match, 0 - no-match)‏ من استخدام قيم منفصلة 
متعددة الصور لنوع الفصيلة لدى كل من المتبرع والمتلقي. وقد يؤدي هذا التبسيط إلى زيادة 
محتوى المعلومات مع تقليل تعقيد العلاقات في البيانات. 


dle JL Lal‏ النهائية من معالجة البيانات الأؤّبية فهي تقليل البيانات. وعلى الرغم من أن 
علماء البيانات (أيّ: محترفو التحليلات) يحبُون الحصول على مجموعات كبيرة من البيانات؛ فإنَّ 
البيانات الزائدة قد تكون أيمًا مشكلة. بمعنى أبسط؛ يمكن للمحلّل أن يتصور البيانات الشائعة 
الاستخدام في مشاريع التحليلات التنبؤية كملفٍ ثابت يتكوّن من يُعدّين: المتغيرات (عدد 
الأعمدة) والحالات/ السجلات (عدد الصفوف). في بعض الحالات (كمعالجة الصور ومشاريع 
genome‏ ع «(82Àx» microarray coL‏ بمكن أن يكون Sas‏ المتغيرات (التي تم تمثيلها 
بالأعمدة) كبيرًا نسبيًاء ويجب على المحلّل تقليل العدد إلى حجم يسهل التحكّم فيه. تُسمّى 
هذه العملية عادةً تخفيض الأبعاد (أو انتقاء المتغير)؛ وذلك لأنّ المتغيرات تتم معالجتها كأبعاد 
مختلفة تَصف ظاهرةٌ من منظورات مختلفة» في التحليلات التنبؤية والتنقيب في البيانات. وعلى 
الرغم من عدم وجود طريقة واحدة مُثلى لإنجاز هذه المهمة؛ فإنه يمكن للمحلل استخدامٌ نتائج 
سابقة النشرء واستشارة خبراء المجال محل الدراسة:» وإجراء اختبارات إحصائية مناسبة (مثل: 
تحليل المكوّنات الأساسية أو تحليل المكوّنات المستقلة)., والأكثر تفضيلًا هو استخدام مزيج من 
هذه التقنيات لتقليلٍ أبعاد البيانات بنجاح إلى مجموعة فرعية أكثر قابليةً للإدارة وأكثر ملاءمةً. 


وفيما يتعلّق بِالبُعْد الآخر (أيْ: عدد الحالات والتي يتم تمثيلها في الصفوف)؛ قد تتضمّن 
بعضٌ خُرْم البيانات ملايين أو مليارات من السّجلات. وعلى الرغم من ازدياد قوة الحوسبة بصورة 
مضاعفة؛ فإنَّ معالجة مثل هذا العدد الكبير من السجلات قد لا يكون عمليًا أو ممكنًا. وفي Ji‏ 
هذه الحالات؛ قد نحتاج إلى تحليل عينة عبارة عن حزمة فرعية من البيانات. وَيُعَدٌَ الافتراض 
الأساسي لأخذ العينات o] sa‏ المجموعة الفرعية من البيانات سوف تحتوي على جميع الأنماط 
المتعلقة بمجموعة البيانات الكاملة. يجب أن يكون ال محلل شديد الحذر عند اختياره للمجموعة 
الفرعية من البيانات» والتي يجبٌ أن تعكسٌّ جوهر مجموعة البيانات الكاملة. وليست خاصة 
بمجموعة فرعية أو فئة فرعية. ويتمٌ 5,3 البيانات عادةٌ على بعض المتغيّرات» وقد يقودنا أخدٌ 
جزءٍ من أعلى البيانات أو أسغلها إلى بيانات مُتحيّزة لقيم مُحدّدة من المتغير المفهرس؛ لذلك 
حاول دائما اختيار السّجلات الموجودة في مجموعة العينات بشكل عشوائي. وبالنسبة للبيانات 
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ا منحرفةء قد لا يكون أخذٌ عيناتٍ عشوائية بصورة مباشرة كافيّ بل قد يكون الأفضلٌ هو أخذ عينة 
طبقية (أيْ: إجراء تمثيلٍ نسبي لمجموعاتٍ فرعية مختلفة من البيانات المتاحة ضمن مجموعة 
بيانات العينة). وعند التعامل مع البيانات المنحرفة فحريٌ بنا تحقيق التوازن بين البيانات 
شديدة الانحراف؛ إما من خلال الإفراط أو التقصير في تمثيل الفقات الأكثر تمثيلًا. وقد أظهرت 
الأبحاث أنَّ مجموعات البيانات المتوازنة تميل إلى إنتاج نماذج تنبؤ أفضل من النماذج غير المتوازنة 
(eY -V£ 35,515 Thammasiri)‏ 


يتم تلخيصٌ جوهر معالجة البيانات في الجدول 1-١‏ الذي يرسم المراحل الرئيسة (جنبًا إلى 
جنب مع أو صاف مشكلاتها) إلى قائمة تمثيلية للمهامٌ والخوارزميات. 


يكاد يكون من المستحيل التقليلٌ من قيمة اقتراح معالجة البيانات. وهي واحدةٌ من تلك 
الأنشطة التي تتطلب وقثًا طويلًا؛ حيث يوت الاستثمار في الوقت والجهد ثمارًا هائلة تغطي على 
تناقص العائدات. وهذا يعني أنه كلما زادت الموارد التي تستثمر فيها؛ زادت الأرباح في النهاية. 
توضّح الحالة العملية ٠-1‏ دراسةً مثيرةً للاهتمام؛ إذ يتم استخدام البيانات الأكادمية الخام 
d oils‏ بسهولة داخل منظمة تعليمية لتطوير نماذج تنبؤية لفهم تسرب الطلاب المبتدئين» 
وتحسين استبقاء الطلاب الجدد في مؤسسة التعليم العالي الكبيرة. بناءً على ما هو مُوضّح في 
الحالة العملية؛ فإنَّ US‏ مهمة من عمليات معالجة البيانات الموضّحة في الجدول Ago als ١-7‏ 
للتنفيذ الناجح لمشروع التحليلات الأساسية: لا سيما المهمة المتعلقة مموازنة مجموعة البيانات. 


جدول aleb yasda : ١-۲‏ معالجة البيانات» والأساليب المحتملة 





ألمهمة الرئيسية المهام الفرعية الطرق الشائعة 
- الوصول للبيانات وجمعها. |- استعلامات .50[1. وكلاء البرامج» خدمات 
- اختيار وتنقية البيانات. الويب. 





- تكامل وتوحيد البيانات. ٠‏ - الخبرة في المجالء استعلامات 8Q1‏ 
توحيد البيانات الاختبارات الإحصائية. 
- استعلامات öss SQL‏ ا مجالء وتصتيف 
البيانات المعتمدة على علم الأنتولوجي. 
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الطرق الشائعة 


المهام الفرعية 


المهمة الرئيسية 





في | - ملء القيم المفقودة (الانحرافات) مع القيم 


الأكثر ملاءمة (الوسيط الوسط الحسابي» 

الحدٌ الأدنى/ الحدٌ الأقصىء المنوال... إلخ). 
ol al -‏ قيمةٍ ثابتة مثل ”.2/1“ للقيم المفقودة؛ 

إزائة سجل القيمة المفقودة؛ عدم فعل أي شيء. 


- التعامل مع القيم المفقودة 
البيانات. 





في|- تحديد القيم المتطرفة في البيانات 


باستخدام تقنيات إحصائية بسيطة (مثل: 
المتوسطات. والانحرافات المعيارية) أو 
بالتحليل العنقودي؛ أو بمجرد تحديدها 
نقوم بإزالة القيم المتطرفة أو تسهيلها 
باستخدام الثنائيات أو الانحدار أو 
المتوسطات البسيطة. 


تحديد وتقليل الضوضاء 
البيانات. 





- تحديد القيم الخطأ في البيانات (بخلاف 
القيم المتطرفة). مثل: القيم الفردية, 
تصنيفات الفئات غير المتسقة. التوزيعات 
الفردية؛ ومجرد تحديدهاء استخدم 
خبرات المجال لتصحيح القيم الخطأء أو 
إزالة السجلات المشتملة على قيم خطأ. 


إيجادء وإزالة البيانات الخطأ. 


تنظيف البيانات 





- تقليل نطاق القِيم في S‏ متغير ذي قيمة رقمية 
إلى نطاق معياري (على سبيل المثال: ٠‏ إلى ١‏ 
أو ٠‏ إلى )١+‏ باستخدام مجموعة متنوعة من 
تقنيات التورزيع الطبيعي أو القياس. 


توزيع البيانات طبيعيًا. 


تحويل البيانات 





- إذا لزم الأمر؛ نقوم بتحويل المتغيرات الرقمية 
إلى تمثيلات منفصلة باستخدام تقنيات 
متعلقة بنطاق أو تكرار المتغيرات الفئوية, 
والحَدٌ من عدد القيم من خلال تطبيق 
التسلسل الهرمي للمفاهيم السليمة. 








فصل أو تجميع البيانات. 
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الطرق الشائعة 


المهمة الرئيسية المهام الفرعية 





- استنباط مُتغيرات جديدة وذات معلومات 
أكثر من المتغيّرات الموجودة بالفعل باستخدام 
مجموعة واسعة من الدوال الرياضية (بسيطة 
مثل الجمع والضربء أو معقدة مثل مزيج 
مختلط من تحؤلات السجل). 


بناء سمات جديدة. 





- تحليل المكؤن الرئيسيء تحليل مكوّن 
مستقلء اختبار ©1-501885©. تحليل 
الارتباطء واستقراء شجرة القرارات. 


تقليل عدد السّمات. 
تقليل المعلومات 





سحب عشوائي للعينات. سحب طبقي 
للعينات. سحب متأنّ للعينات باستخدام 
الخبرة والمعرفة السابقة. 

استخلص أقلّ تمثيل أو تمثيل الفئات الأكثر Xe‏ 








توازن البيانات المنحرفة. 


تقليل عدد السّجلات. 











wa 


حالة عملية ۲-۲ 
تحسين الاحتفاظ بالطلاب باستخدام التحليلات المعتمدة على البيانات 


أصبحت ظاهرةٌ تسرب الطلاب واحدةً من أكثر التحَدّيات التي تواجه صانعي 
القرار في المؤسسات الأكاديمية. فعلى الرّغم من كلّ البرامج والخدمات التي تمّ وضعها 
للمساعدة في الاحتفاظ بالطلاب؛ وفقًا لوزارة التعليم الأمريكية ومركز الإحصائيات 
التعليمية (265.60.807)؛ فلا يحصل على درجة البكالوريوس أكثر من نصف الذين 
يلتحقون بالتعليم العالي. أصبحت إدارة التسجيل والإبقاء على الطلاب أولويةٌ قصوى 
هديري الكليات والجامعات في الولايات المتحدة وبلدان أخرى حول العالم. فعادةٌ ما 
يؤدي التسرّب الكبير للطلاب إلى خسارة مالية عامة» وانخفاض معدلات التخرّج» وسمعة 
تربوية أدنى في نظر جميع أصحاب المصلحة. إذ يبحث JS‏ من المشرّعين وصانعي 
السياسات الذين يشرفون على التعليم العالي ويُخمّصون له الموازات do pid‏ وكذلك 
الآباءٌ الذين يدفعون تكاليف تعليم أبنائهم؛ بغرض إعدادهم لمستقبلٍ أفضلء وأيضًا 
الطلاب الذين يختارون التخمّصات الجامعية - يبحث JS‏ هؤلاء - عن أدلة على الجودة 
المؤسسية والسّمعة لتوجيه عمليات صُنع القرار الخاصة بهم. 
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exi dort 

لتحسين الاحتفاظ بالطلاب؛ يجب عفى ol Ial Jidl‏ يحاول فهم الأسباب غير 
لواهية وراء التسرّب من التعليم. ولي ننجح في ذلك؛ علينا أولًا أن نحَدّد وبدقة 
الطلاب الذين يُداهمهم خطر التسرّب. حتى الآن؛ تمّ تكريسٌُ الغالبية العظمى من 
بحوث استنزاف الطلاب لفهم هذه الظاهرة الاجتماعية المعقدة والحاسمة في نفس 
لوقت. وعلى الرّغم من أن هذه الدراسات النوعية والسّلوكية والاستقصائية كشفت 
عن رؤية ثمينة للغاية من خلال تطوير واختبار مجموعة واسعة من النظريات؛ فإنها 
لا توفر الآلية اللازمة للتنبؤ الدقيق (والتطوٌر المحتمل) لتسرّبٍ الطلاب. قدّم المشروع 
المختصر في دراسة هذه الحالة نهجًا بحثيًا كميّ؛ إذ يمكن استخدام البيانات المؤسسية 
التاريخية من قواعد بيانات الطلاب لتطوير نماذج قادرة على التنبؤ بالإضافة إلى توضيح 
طبيعة المؤسسة الخاصة بمشكلة التسرِّب. ويوضّح الشكل 6-١'‏ منهج التحليلات المقترح. 

وعلى الرغم من كون المفهوم جديداً نسبيًا على التعليم العالي لأكثر من عقد من 
لزمان؛ فقد تمت دراسة مشكلات مماثلة في مجال إدارة التسويق باستخدام تقنيات 
تحليلات البيانات التنبؤية تحت اسم Jll os ilay gys «churn analysis»‏ 
التالي: «مّن مِن عملائنا الحاليين أكثر ميلاً للتوقف عن شراء منتجاتنا أو خدماتنا؟» 
بحيث هكن إجراء نوع من عمليات الوساطة أو التدخل للإبقاء عليهم؛ Sd M‏ 
الاحتفاظ بالعملاء الحاليين أمراً بالغ الأهمية؛ لأننا وكما نعلم جميعًاء وكما أظهرت 
البحوث المتعلقة مرارًا وتكراراه أن تكاليف وجهد ووقت كسب عميل جديد أكثر بقدرٍ 
كبير من محاولة الحفاظ على العميل الموجود بالفعل. 

البيانات من الجوهر: 

جاءت بيانات هذا المشروع البحثي من مؤسسة واحدة (وهي جامعة عامة شاملة 
تقع في منطقة الغرب الأوسط بالولايات المتحدة) بمتوسط تسجيل يبلغ 7٠٠١‏ طالب» 
منهم حوالي ZA‏ من المقيمين في نفس الولاية. وحوالي 19“ منهم من الأقليات. لا يُوجَد 
فرقٌ معنوي بين الجنسين في أرقام التسجيل. كان متوسط نسبة الاحتفاظ بالطلاب 
الجّدد في المؤسسة حوالي .0١‏ ومتوسط نسبة التخرّج لمدة ” سنوات حوالي XV‏ 





استخدمت الدراسة © سنوات من البيانات المؤسسية» والتي شملت أكثر من ١5٠٠١‏ 
طالب مُسجلين كطلاب جُدُّد. تم جمعهم من قواعد بيانات مختلفة ومتنوعة للطلاب 
الجامعيين. وقد تضمّتَت البياناتٌ المتغيرات المتعلقة بالخصاكص الأكادمية واطالية 
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والتوزيع السكاني للطلاب. وبعد دمج وتحويل البيانات المتعددة الأبعاد لكلّ طالب إلى 
ملف مُسطّح واحد (أيْ: ملف يحتوي على أعمدة تمثّل المتغيرات وصفوف تمثل سجلات 
الطالب) تم تقييمٌ الملف الناتج ومعالجته مسبقاً لتحديد ومعالجة القيم الشاذة وغير 
القابلة للاستخدام. فعلى سبيل المثال: قامت الدراسة بإزالة كل سجلات الطلاب الدوليين 
من حزمة البيانات؛ لأنها م تحتو على معلومات عن بعض المتنبئين ذوي السّمعة الطيبة 
(مثل: المدرسة الثانوية «GPA‏ ودرجات '547). في مرحلة تحويل البيانات؛ تم تجميعٌ 
بعض المتغيراتء (فمثلاً: يتم تجميع المتغيرات ”الرئيسية“ و”الكثيفة“ إلى متغيرات 
de Jya (ConcentrationSpecifiedg MajorDeclared åót3‏ تفسیر أفضل 
للنمذجة التنبؤية. بالإضافة إلى ذلك؛ تم استخدام بعض المتغيرات لاشتقاق متغيرات 
جديدة (مثل: نسبة ا مكتسب/ ا مسجل وسنوات ما بعد المدرسة الثانوية). 





mig xal‏ اعد يياناات مؤسسية)» 


EIE pe | 







































































شكل :٤-۲‏ منهج التحليلات للتنبؤ بتسرّب الطلاب 
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المكتسبة/ المسجلة - الساعات المكتسبة/ الساعات المسجلة 
سنوات ما بعد المدرسة الثانوية - سنة تسجيل في الجامعة - سنة التخرّج من المدرسة الثانوية 

تمّ إنشاء النسبة المكتسبة/ المسجّلة؛ للحصول على تمثيلٍ أفضل مرونة الطلاب 
وتقريرهم في الفصل الدراسي الأول من السنة الدراسية الأولى في الجامعة. وبشكلٍ 
منطقي؛ فإنه من المتوقع أن تؤثر القيم الأكبر لهذا المتغير بشكلٍ إيجابي على 
الاستبقاء/ الثبات. تمّ إنشاء مصطلح سنوات ما بعد المدرسة الثانوية لقياس 
تأثير الوقت المّستغرّق بين التخرّج من المدرسة الثانوية والتسجيل الأوّلي بالكلية. 
ومنطقيًا؛ فمن المتوقع أن يُسهم هذا المتغيّر في التنبؤ بتسرّب الطلاب. يتم تحديدٌُ 
هذه المجموعات والمتغيّرات المشتقة بناءً على عدد من التجارب التي تمَّ إجراؤها 
لعدد من الفرضيات المنطقية. وتم حفظ هذه التجارب والفرضيات في حزمة 
المتغير النهائيء وهي التي رفعت مستوى الحساسية وأيضًا أَدّت إلى الوصول إلى 
مستوى أفضل من دقة التنبؤ. تعكس الطبيعة الحقيقية للسكان (أيْ: الطلاب 
الجدد). والمتغير التابع «e gaal gilla (“Second Fall Registered” xl)‏ 
الکٹیر من سجلات نعم (~ ۸۰) وسجلات لا (- ١7؛‏ انظر: الشكل ؟-0). 

تظهر البحوث أن وجود مثل هذه البيانات غير المتوازنة يؤثر سلبيًا على أداء 
النموذج. ولذلك؛ جرّبت الدراسة خيارات استخدام ومقارنة نتائج نفس النوع 
من النماذج التي ثمّ بناؤها مع البيانات الأصلية غير المتوازنة (متحيّزة لسجلات 
نعم) والبيانات المتوازنة جيدًا. 
النمذجة والتقييم: 

قامت الدراسة باستخدام أربع طرق تصنيف شائعة الاستخدام (أيْ: الشبكات 
العصبية الاصطناعية. وشجرات القرارء وآلة المتجهات الداعمة: والانحدار 
اللوجستي) جنباً إلى جنب مع ثلاثة أطقم من تقنيات المجموعات النموذجية 
(أيْ: تعبنة وفصلء ودمج المعلومات). ثم ّت بعد ذلك مقارنة النتائج التي تمّ 
الحصول عليها من جميع أنواع النماذج بعضها مع بعض باس تخدام طرق تقييم 
موذج التصنيف المنتظم (مثل: الدقة التنبقية الشاملة: الحساسيةء النوعية) على 
عيّنات التحمّل. 
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شكل 0-7: تصوير بياني لمشكلة عدم توازن الفئات 

في خوارزميات تعلّم الآلة (والتي سيتمٌ تغطية بعضٍ منها في الفصل 6), 
يُعَذُ تحليل الحساسية طريقةً لتحديد علاقة ”السبب والنتيجة“ بين مدخلات 
ومُخرجات نموذج التنبق المعطى. وتُعَدٌ الفكرة الأساسية وراء تحليل الحساسية أنه 
يقيس أهمية متغيرات التوقع على أساس التغيير في أداء النمذجة الذي يحدث إذا 
لم يتم تضمين متغير توقع في النموذج. ويُطلّق على ممارسة النمذجة والتجارب 
هذه أيضًا .(a leave-one-out assessment) e Deas‏ ومن ثم؛ فإن مقياس 
حساسية متغير تنبؤ مُحدَّد هو نسبة الخطأ في النموذج المدرّب بدون متغير 
التنبؤ إلى خطأ النموذج الذي يتضمن متغير المتنبئ هذا. وكلما كانت الشبكة 
أكثر حساسية لمتغير معين, زاد انخفاصٌ الأداء في غياب هذا المتغيره ومن ثم زادت 
نسبة الأهمية. وبالإضافة إلى القوة التنبؤية للنماذج؛ فقد أجرت الدراسة أيضًا 
تحليلات الحساسية لتحديد الأهمية النسبية لمتغيرات الإدخال. 
النتائج: 

في المجموعة الأولى من التجاربء استخدمت الدراسة مجموعة البيانات 
الأصلية غير المتوازنة. واستنادًا إلى نتائج تقدير الصلاحية المتقاطع ذي ال 
٠‏ مراحل فقد أنتجت خوارزمية آلة المتجهات الداعمة (51781) أفضل دقة 
بمعدل تنبؤ إجمالي يبلغ ۸۷,۲۳ وجاءت شجرة القرار في المركز الثاني بمعدّل تنبؤ 
إجمالي قدره ۸۷,١١‏ تليها الشبكات العصبية الاصطناعية معدل تنبؤ إجمالي 
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6 ثم الانحدار اللوجستي معدل تنب إجمالي قدره ۸1,١١‏ (انظر: الجدول 
(Y-Y‏ ويكشف الفحص الدقيق لهذه النتائج أنَّ دقة التنبو لفئة ”نعم“ أعلى 
بشكل معنوي من دقة التنبؤ للفئة ”لا“. في الواقع؛ تنبأت جميع أنواع النماذج 
الأربعة بالطلاب الذين يرجح عودتهم للسنة الثانية بدقة تبلغ ١5؟‏ لكنها Sl)‏ 
النماذج) تنبأت بالطلاب المحتمل أن ينقطعوا عن الدراسة بعد عام دراسي جديد 
بمستوى دقة لا يصل إلى ./6٠‏ ولأن التنبؤ بفئة ”لا“ هو الهدف الرئيسي من هذه 
الدراسة؛ فإن دقة أقل من 0٠‏ لهذه الفئة تُعَدُ غير مقبولة. ومن الممكن (بل 
من الواجب) أن يُعرّى مثل هذا الاختلاف في دقة التنبؤ للفئتين إلى الطبيعة غير 
المتوازنة للمجموعة البيانات التدريبية (أي: - AA‏ ”نعم“ ول - XY‏ "9 

TABLE 2.2 Prediction results for the Original/unbalanced Data set 








ANN(MLP) DT(C5) SW كا‎ 
No Yes No Ys No Ys No Ys 
No 1494 384 1518 304 1478 255 1438 376 
Yes 1596 — 11142 1572 11222 1612 11271 1652 — 11150 
SUM 3090 11526 3090 11576 3090 11526 3090 11526 
PerClass Accuracy — 4835 9067986 498136 930% 47838 9779% 4654% 974% 
Overall Accuracy 8645% 8716% 87123% 12% 





استخدمت الجولة التالية من التجارب مجموعة بيانات متوازنة؛ إذ يتم تمثيل الفئتين 
بالتساوي تقريباً. وف سبيل تحقيق هذا الأسلوب؛ أخذت الدراسة جميع العينات من 
فئة الأقلية (أيْ: الطبقة «لا») واختارت عشوائياً عدداً متساوياً من العينات من طبقة 
الأغلبية (أَيْ: الطبقة «نعم») وتمّ تكرارٌ هذه العملية ٠١‏ مرات لتقليل التحيّز ا محتمل 
للعينة العشوائية. وتمخّضمَّت كل عملية من عمليات أخذ العينات هذه عن مجموعة 
بيانات تضم ما يزيد عن ٠٠٠٠١‏ سجلء والتي تم فيها تمثيلٌ كلا الفئتين («نعم» و«لا») 
بالتساوي تمامًا. مرةً أخرى. وباستخدام منهجية تقدير الصلاحية ذي ال ٠١‏ مراحل؛ 
قامت الدراسة بتطوير واختبار تماذج تنبؤ لجميع أنواع النماذج الأربعة. ويبَيّن الجدول 
Y-Y‏ نتائج هذه التجارب. وبناءً على نتائج العينة المتحمّل عليها من قبل؛ قامت آلة 
المتجهات الداعمة مرةٌ أخرى بإفراز أفضل معدل دقة للتنبؤ بشكل عام بنسبة 211,18 
متبوعة بأشجار القراره والشبكات العصبية الاصطناعيةء والانحدار اللوجستي بمعدلات 
AVIAC ۸٠,10 RLS dale $5 d$»‏ و6,71/ا* على الترتيب. وكما يتضح من معدلات 
الدقة لكلّ فئة؛ فإن نماذج التنبؤ كانت أفضل بشكلٍ معنوي في التنبق بفئة ”لا“ باستخدام 
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البيانات المتوازنة مقارنة بها عند استخدام البيانات غير المتوازنة. وبشكلٍ عام؛ كانت 
تقنيات تعلّم الآلة الثلاثة أفضل بكثير من نظيرتها الإحصائية الانحدار اللوجستي. 














[TABLE2.3 Prediction results for the balanced Data set 
Confusion ANNIMLP) DT(C5) SWM iR 
Matrix No Ys No * No » No Ns 
No 2309 — 484 — 231. — 417 — 2313 — 306 — 2125 — 626 
*» 781 — 2000 779 — 208 77 204 — 905 — 2404 
SUM 3090 3090 3090 3090 3090 3090 309 00 
Perclass Accuracy nn $498 1419% 8650 7485% 8751% 6877% TAS 
Overall Accuracy 7985% LI] 18% 7426% 

















ةة 


بعد ذلك؛ تم إجراءً مجموعة أخرى من التجارب لتقدير القدرة التنبؤية للنماذج 
الثلاثة. واستنادًا إلى نتائج تقدير الصلاحية المتقاطع ذي ال ٠١‏ أجزاء أنتج نموذج مجموعة 
اندماج المعلومات أفضل النتائج بمعدل تنبؤ إجمالي يبلغ ۸۲,۱۰ ثم مجموعات من 
نوع التعبئة ومجموعات من نوع الدّعم بمعدلات تنبو إجمالية تبلغ 2۸1,۸۰ و١١٠۸‏ 
على التوالي (انظر: الجدول 6-1). وعلى الرغم من أن نتائج التنبؤات أفضل إلى حَدٌّ ما من 
لنماذج الفردية؛ فإنه من المعروف أن مجموعات النماذج تنتج أنظمة تنبؤ أكثر متانةٌ 
مقارنةٌ بنموذج التنبؤ الأحادي (وسيتم توضيح ذلك هزيد من التفصيل في الفصل .)٤‏ 

















TABLE 24 Prediction results for the three ensemble Models 
Boosting Bagging Information Fusion 
(Boosted Trees) (Random Forest) (Weighted Average) 
No Yes No Yes No Yes 

No 2242 ars 2327 362 2335 351 
Yes 848 2715 763 2728 755 2739 
SUM 3090 3090 3030 3090 3090 3090 
Per Class Accuracy 7256% 8786% 75318 88205 7557% 88.64% 

Overall Accuracy 8021% 81808 210% 








إضافة إلى تقدير دقة التنبؤ لكل نوع من أنواع النماذج؛ 65 إجراءٌ تحليل الحساسية أيصًا 
باستخدام نماذج التنبؤ المطوّرة لتحديد الأهمية النسبية للمتغيرات المستقلة (أَيْ: المتنبئين). 
ولتحقيق نتائج تحليل الحساسية الشاملة؛ أنتج Js‏ نوع من أنواع النماذج الفردية الأربعة 
مقاييس حساسية خاصة به؛ بحيث تعمل على تصنيف جميع المتغيرات المستقلة في قائمة مرتبة 
بالأولوية. وكما هو متوقع؛ فقد أفرز 5 نوع من أنواع النماذج مراتب حساسية متفاوتة نوعًا 
ما من المتغيرات المستقلة. وبعد جَمْع كلّ المجموعات الأربع من أرقام الحساسية؛ يتم توزيع 
أرقام الحساسية تلك توزيعًا طبيعيًا وتجميعها ورسمها في شكلٍ بياني أفقي (كما بالشكل 5-9). 
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الاستنتاجات: 


أظهرت الدراسة أن وجود بيانات كافية بمتغيّرات ملائمة يقود إلى أساليب استخراج 
بيانات لديها القدرة على التنبؤ بنسبة تسرب الطلاب الحُدد بدقة تصل إلى JE 33 XA‏ 
كما أظهرت النتائج آنه asus‏ النظر عن نموذج التنبؤ seda ul‏ فإن مجموعة البيانات 
المتوازنة (مقارنة بمجموعة البيانات غير المتوازنة/ الأصلية) أنتجت نماذج أفضل في التنبؤ 
بالطلاب الذين من امرجَّح تسرّبهم من الكلية قبل سنتهم الدراسية الثانية. ومن بين نماذج 
التنبؤات الفردية الأربعة المُستخدمة في هذه الدراسة: كان أداء آلة امتجهات الداعمة 
هو الأفضلء تليها أشجار القرار. ثم الشبكات العصبية, وأخير الانحدار اللوجستي. GÍ‏ 
من زاوية سهولة الاستخدام؛ فعلى الرغم من حقيقة أن آلة المتجهات الداعمة أظهرت 
نتائج أفضل للتنبؤ؛ فإِنَ القائم بالتحليل قد يختار استخدام أشجار القرار؛ لأنها با مقارنة 
مع آلة المتجهات الداعمة والشبكات العصبية؛ فهي تصوّر هيكل نموذج أكثر شفافية. 
أيضًا تظهر أشجار القرار بشكلٍ واضح عملية استنتاج التنبؤات المختلفة؛ مما يوفر تبريرًا 
منطقيًا لنتائج معينة؛ في حين أن آلات ناقلات الدعم والشبكات العصبية الاصطناعية ما 
هي إلا نماذج رياضية لا تقدّم رؤية شفافة حول «كيف يفعلون ما يفعلون؟». 

أسئلة للمناقشة: 

-١‏ ما هو تسرب الطلاب» وماذا يُعَد مشكلة مهمة في التعليم العالي؟ 

۲- ماذا كانت الطرق التقليدية للتعامل مع مشكلة تسرب الطلاب؟ 

-٠‏ قم oo‏ ومناقشة التحَدَّيات المتعلقة بالبيانات في سياق دراسة هذه الحالة. 

Jol OBS Ile -£‏ المقترح؟ وماذا كانت النتائج؟ 


Sources: Thammasiri, D., Delen, D., Meesad, P, & Kasap N. (2014). A critical 
assessment of imbalanced class distribution problem: The case of predicting 
freshmen student attrition. Expert Systems with Applications, 41(2), 321330-; Delen, 
D. (2011). Predicting student attrition with data mining methods. Journal of College 
Student Retention, 13(1), 1735-; Delen, D. (2010). A compara- tive analysis of 
machine learning techniques for student retention management. Decision Support 


Systems, 49(4), 498506-. 
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أسئلة مراجعة على القسم :£-Y‏ 
-١‏ مماذ! لا تكون البيانات الأصلية/ الخام قابلة للاستخدام بسهولة؛ من خلال مهام التحليلات؟ 
-Y‏ ما الخطوات الرئيسية بلعالجة البيانات؟ 
*- ما المقصود ب تنظيف/ تنقية البيانات؟ وما الأنشطة التي يتم القيام بها في هذه المرحلة؟ 
IU -é‏ نحتاج إلى تحويل البيانات؟ وما هي مهام تحويل البيانات شائعة الاستخدام؟ 
5- يمكن تخفيض البيانات على الصفوف (أخذ العينات) و/ أو الأعمدة (اختيار متغير). أيهما أكثر تحديًا. 
0-٠‏ النمذجة الإحصائية لتحليلات الأعمال: 

بسبب تزايد رواج تحليلات الأعمال؛ فإن الطرق الإحصائية التقليدية والتقنيات الأساسية 

تستعيد أيضًا جاذبيتها كأدوات تمكينية لدعم صُنع القرارات الإدارية المبنية على الأدلة. وهي 

بذلك y‏ تستعيد فقط الاهتمام والإعجاب» ولكنها GYI‏ تجذب مستخدمي الأعمال إضافةٌ إلى 
خبراء الإحصاء ومحترفي التحليلات. ole‏ ما 5 تعتبر الإحصائيات (الطرق الإحصائية والتقنيات 
الأماسية) جزءًا من التحليلات الوصفية (انظر: الشكل .)/-٠‏ كما هكن اعتبار بعض الأساليب 
الإحصائية أيضًا جزءًا من التحليلات التنبؤية مثل تحليل التمايزء والانحدار المتعدد, والانحدار 
اللوجستي» k-means clustering‏ وكما هو موضّح في الشكل ۷-۲؛ فإن للتحليلات الوصفية 
فرعين رئيسين هما: الإحصاءات» ومعالجة التحليلات OLAP 3&1 (OLAP) CGAY! ye‏ 
هو المصطلح ا مستخدّم لتحليل وتوصيف وتلخيص البيانات المهيكلة المخرّنة في قواعد البيانات 
التنظيمية (غالباً ما يتم تخزينها في مستودع البيانات أو في سوق البيانات. وسيتمٌ تغطية 
تفاصيل مستودعات البيانات في الفصل ۳) باستخدام مكعبات (أيْ: هياكل بيانات مُتعدّدة 
الأبعاد والتي يتم إنشاؤها لاستخراج مجموعة فرعية من قيم البيانات للإجابة عن سؤال أعمال 
معين). كما أطلق على فرع 01,47 للتحليل الوصفي اسم ذكاء الأعمال. من ناحية أخرى؛ 
تساعد الإحصائيات في توصيف البيانات إِمّا على متغير واحد في كلّ مرة أو متغيرات متعددة 
معا باستخدام إما أساليب وصفية أو استنتاجية. 
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شكل :۷-١‏ العلاقة بين الإحصاء والتحليلات الوصفية 

كانت الإحصائيات - وهي مجموعة من التقنيات الرياضية لتوصيف وتفسير البيانات - موجودةٌ 
منذ وقتٍ طويل. وقد تمّ تطوير العديد من الأساليب والتقنيات لتلبية احتياجات ا مستخدمين 
النهائيين ومعالجة الخصائص الفريدة للبيانات التي يتم تحليلها. وبشكل عام وعلى أعلى مستوى» 
فيمكن تصنيف الأساليب الإحصائية على أنها إما وصفية أو استنتاجية. ويكمُّنْ الفرق الرئيس 
بين الإحصاء الوصفي والاستنتاجي في البيانات المُستخدّمة في هذه الطرق - في حين يقوم الإحصاء 
الوصفي على وصف بيانات العينة المتاحة» تتعلق الإحصاءات الاستقصائية برسم استدلالات أو 
استنتاجات حول خصائص السكان. وسنقوم إيجازا في هذا القسم» بوصف الإحصائيات الوصفية 
(لأنها بالفعل تضع حجر الأماس للتحليلات الوصفيةء وعد كذلك الجزء الأساسي منها» آما في 
القسم التالي؛ فسنغطي الانحدار (بنوعيه الخطي واللوجستي) كجزء من الإحصاءات الاستدلالية. 


الإحصاء الوصفي للتحليلات الوصفية: 


تُوضّح الإحصائية الوصفية» كما يُوحي الاسم. الخصائص الأساسية للبيانات المتحصّل عليهاء 
وغالبًا ما يكون هناك متغيرٌ واحدٌ في كل مرة. وباستخدام المعادلات والمجموعات العددية, 
تستطيع الإحصاءات الوصفية تلخيص البيانات بطريقة تؤدي في الغالب إلى الخروج من الدراسة 
بأماط سهلة الفهم وذات معنى. وعلى الرغم من أن الإحصاء الوصفي مفيدٌ جدًا في تحليلات 


WA‏ ذكاء الأعمال والتحليلات OBLI pleg‏ منظور إداري 


التحليلات الوصفية :)١(‏ طبيعة البيانات» النمذجة الإحصائية, تصوير البيانات 


البيانات» وأيضًا له الرّواج الأعلى في الاستخدام بين الأساليب الإحصائية؛ فإنه لا يسمح بعمل 
استنتاجات (أو استدلالات) تتجاوز عينة البيانات التي يتم تحليلها. أيْ: إنه ببساطة يُعَلُ 
طريقةً جيدةٌ لتوصيف ووصف البيانات المتاحة. دون الحصول على استنتاجات (الاستدلالات 
أو الاستقراءات)؛ وذلك فيما يتعلق بسكان الفرضيات ذات الصّلة التي قد نضعها في الاعتبار. 
وفي تحليلات الأعمال؛ تلعب الإحصائيات الوصفية دورًا حساسًا - فهي تتيح لنا فهم وشرح/ 
تقديم بياناتنا بطريقة هادفة باستخدام الأرقام المجمّعة أو جداول البيانات أو الخرائط/ الرسوم 
البيانية. وفي جوهر الإحصائيات الوصفية؛ فهي تساعدنا على تحويل الأرقام والرموز التي بأيدينا 
إلى تمثيلات ذات معنى يستطيع أي شخص أن يفهمها ويستخدمها بسهولة. لا يساعد هذا 
الفهم مستخدمي الأعمال في عمليات صُنع قراراتهم فحسب؛ بل يساعد كذلك محترفي التحليلات 
وعلماء البيانات على توصيف واختبار صلاحية البيانات لمهامّ تحليلية أخرى أكثر تعقيدًا. كما 
يسمح الإحصاء الوصفي للمحللين بتحديد التنسيق 13]8108:ءعد0» 0814. وكذلك القيم الكبيرة 
أو الصغيرة غير المعتادة (أيْ: القيم المتطرفة)» وقيم البيانات الموزّعة بشكلٍ غير متوقع للمتغيرات 
الرقمية. ولذلك؛ فيمكن تصنيف الطرق في الإحصاء الوصفي إما كمقاييس للميل المركزي أو 
مقاييس للتشتت. وسنستخدم في القسم التالي وصفًا بسيطًا وصياغة رياضية/ تمثيلًا رياضيًا 
لهذه المقاييس. في التمثيل الرياضي؛ سنستخدم es eon Poo Vou Agu‏ لتمثيل القيم المنفردة 
(الملاحظات) للمتغير (قياس) الذي نحن بصدد توصيفه. 


مقاييس النزعة المركزية (كما يمكن أن يُطلق عليها مقاييس الموقع, أو المقاييس المركزية): 
تُحَنُ المقاييس المركزية؛ هي الطرق الرياضية التي نستخدمها في تقدير ووصف الوضع المركزي 
للمتغير المعطى محل الدراسة. وَيُعَدٌ مقياس الاتجاه المركزي قيمةٌ عدديةً مفردةٌ تهدف إلى 
وصف مجموعة من البيانات؛ من خلال تحديد أو تقدير الموقع المركزي ضمن البيانات بوضوح. 
ويُعَدٌ المتوسط (والذي يُطلق عليه غالبًا الوسط الحسابي أو المتوسط البسيط). هو المقياس الأكثر 
استخدامًا للاتجاه المركزي. بالإضافة إلى المتوسطء من الممكن أيضًا استخدام الوسيط أو المنوال 
المُستخدّم لوصف المركزية للمتغير المعطى. وعلى الرغم من أن الوسط الحسابي والوسيط والمنوال 
كلها مقاييس صحيحة للاتجاه المركزي؛ فإنه في بعض الحالات ووفقًا لظروف معينة, تكون إحدى 
هذه المقاييس أكثر ملاءمةً من الأخرى. وفيما يلي أوصاف مختصرة لهذه المقاييس: مما في ذلك 
كيفية حسابها رياضيًا مع الإشارة إلى الظروف التي تجعل أحدها أنسب في الاستخدام من غيره. 
- الوسط الحسابي: (أو المتوسط البسيط أو المعدل) هو مجموع JS‏ القيم/ الملاحظات مقسومًا على 
عدد تلك الملاحظات في حزمة البيانات. وهو إلى uso 3o‏ يُعَدُ الأكثر رواجًا وشيوعًا في قياس النزعة 
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المركزية. 925 استخدامه مع بيانات رقمية مستمرة أو منفصلة. بالنسبة للمتغير سء إذا حصلنا 
على عدد ن من القيم/ الملاحظات (س١.‏ س۲ س۳ ..» س ن)؛ فيمكننا كتابة الوسط الحسابي لعينة 








البيانات (سء وتنطق س - بار) كما يلي: (يتم استبدال كل (×) ب سء وكل (2) ب ن) 
Loo Xt xoc ot X,‏ 
WT‏ 
or‏ 
zc Xx‏ 
mn‏ = 











يمتلك الوسط العديد من الخصائص الفريدة؛ فعلى سبيل المثال: يكون مجموع الانحرافات 
المطلقة (الفروق بين الوسط الحسابي والقيم) فوق الوسط هي نفس مجموع الانحرافات التي 
تحت الوسط مع مراعاة توازن القيم في كلا الجانبين. ومع ذلكء فإن هذا لا يعني أن نصف 
عدد القيم يكون أعلى الوسط الحسايء والنصف الآخر أقل منه (فهذا اعتقادٌ خطأ شائعٌ بين 
أولئك الذين لا يعرفون الإحصائيات الأساسية). وأيضًا as‏ الوسط مقياسًا فريدًا لكل مجموعة 
das osa ad «ola‏ للحساب لكل ما يتعلق بالبيانات والفترات العددية. وَيُعَنٌ أحد أكثر 
العيوب الرئيسة في الوسط الحسابي؛ هو تأثره بالقيم المتطرفة (القيم التي تكون أكبر أو أصخر 
بكثير من بقية نقاط البيانات). إذ تقوم القيم المتطرفة بسحب الوسط نحوهاء وبالتالي يحدث 
soto‏ في التمثيل المركزي. ولذلك؛ في حالة وجود قيم متطرفة أو إذا كانت البيانات مبعثرة 
ومنحرفة بطريقة عشوائية؛ فيجب على المحلل تنب استخدام الوسط الحسابي كمقياس 
مركزي أو إضافته مع مقاييس النزعة المركزية الأخرى» مثل: الوسيط والمنوال. 
- الوسيط: هو مقياس لقيمة المركز في حزمة البيانات المعطاة. أَيْ: هو الرقم الواقع في وسط 
مجموعة معينة من البيانات التي 3( ترتيبها / فرزها حسب حجمها (إما تصاعديًا أو تنازليًا). 
إذا كان عددُ القيم رقمًا فرديًا؛ فإن تحديد الوسيط سهل للغاية - فقط قم بفرز القيم بناءً على 
قيمها واختر القيمة الصحيحة التي في الوسط تمامًا. أما إذا كان عدد القيم رقمًا زوجيًا؛ فقم 
بتحديد القيمتين الواقعتين في المنتصفء ثم خذ المتوسط البسيط لهاتين القيمتين. يُعَد الوسيط 
ملائماً وقابلاً للحساب لأنواع معينة من البيانات كالنُّسبء والفترات الفاصلة» والبيانات الترتيبية. 
وبمجرد تحديد الوسيطء يكون نصف عدد البيانات في الأعلى منه والنصف الآخر أدناه. وعلى 
عكس الوسط الحسابيء لا يتأثر الوسيط بالقيم المتطرفة أو البيانات المنحرفة. 
- المنوال: هو القيمة التي تحدث بشكلٍ متكرر (القيمة الأكثر تكرارًا في مجموعة البيانات). ويتمٌ 
تمثيله على الرسم البياني بالعمود الأعلى» وبالتالي» هكن اعتباره الخيار/ القيمة الأكثر شيوعًا. 


Me‏ ذكاء الأعمال والتحليلات وعلم البيانات, منظور إداري 


التحليلات الوصفية :)١(‏ طبيعة البيانات» النمذجة الإحصائية, تصوير البيانات 


ويكون المنوال مفيدًا جدًا في حالة مجموعات البيانات التي تحتوي على عدد صغير نسبيًا من 
القيم الفريدة. أي إنه قد يكون عديم الفائدة إذا كانت البيانات تحتوي على الكثير من القيم 
الفريدة (كما هو الحال في العديد من القياسات الهندسية ذات الدقة العالية والعدد الكبير 
من الخانات العشرية)؛ مما يجعل كلّ قيمة تحتوي على رقم واحد تمثل تكرارًا خاضًا بها. وعلى 
الرغم من كونه مقياسًا مفيدًا (خاصة للبيانات الاسمية)؛ فإنه لا يمثل المركزية بصورة جيدة؛ 
ولذلك لا ينبغي استخدامه كمقياس وحيد للنّزعة ا مركزية لمجموعة بيانات معينة. 
باختصار؛ أي من مقاييس الاتجاه المركزية يُعَدَُ الأفضل؟ في الواقع لا تُوجّد هناك إجابةٌ 
واضحةً لهذا السؤال؛ ولكن هناك بعض الإشارات نعرض لها فيما يلي: استخدم الوسط الحسابي 
عندما لا تكون البيانات ميّالة للقيم المتطرفة, وليس بها انحرافات معنوية؛ استخدم الوسيط 
عندما تكون بالبيانات قيم متطرفة و/ أو أن تكون بطبيعتها بيانات ترتيبية؛ استخدم المنوال 
عندما تكون البيانات اسمية. ولعل أفضل هذه الممارسات هو استخدام كلّ هذه المقاييس الثلاثة 
معّا؛ بحيث يكن الوصول للاتجاه المركزي لمجموعة البيانات» وتمثيله من وجهة JS. à‏ مقياس 
على حِدّة. ولأن المعدّل ”أو المتوسط“ هو يكون غالبًا مفهومًا مألوقًا للغاية ومُستَخدَمًا بشكل 
uS‏ للجميع في الأنشطة اليومية المتكرّرة بانتظام؛ فغالبًا ما ييستخدم المديرون (وكذلك بعض 
العلماء والصحفيين) المقاييس المركزية (خاصة الوسط الحسابي) بشكلٍ غير ملائم خاصةٌ عندما 
يستلزم الأمر التعامل مع المعلومات الإحصائية الأخرى من منظور المركزية. ومن الأفضل تقديم 
إحصائيات وصفية كحزمة - عبارة عن مزيج من مقاييس مركزية وتشثّت - في مقابل مقياس 
واحد مثل الوسط الحسابي. 


مقاييس التشتّت uaig)‏ أيضًا مقاييس الانتشار أو الامتداد): 

تُعَذّ مقاييس التشّت هي الطرق الرياضية المُستَخدّمة لتقدير أو وَضْف درجة التباين في ا متغير 
المعطى الذي يكون محل الدراسة. وهي تمثل الانتشار الرقمي (الاكتناز أو عدمه) لمجموعة البيانات 
المعطاة. ولوصف هذا التشتتء تمّ تطوير عدد من المقايبس الإحصائية؛ وأبرزها: النطاق» والتباين» 
والانحراف ال معياري (وكذلك الربيعات» والانحراف المطلق). kt‏ أحد الأسباب الرئيسية وراء أهمية 
مقاییس تششت/ انتشار قيم البيانات» هو أنه يمنحنا إطارًا يمكننا من خلاله الحكم على النزعة 
المركزية - وذلك بأن يعطينا إشارة d!‏ مدى جودة الوسط الحساي (أو المقاييس المركزية الأخرى) 
عند تمثيل بيانات العينة. وإذا كان تشثّت edil cias‏ في مجموعة البيانات كبيرً؛ فلا يُعتّبر الوسط الحسابي 
تمثيلًا جيدًا للبيانات. وذلك لأن قياس التشئّت الكبير يشير إلى اختلافات كبيرة بين الدرجات المنفردة. 
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وفي البحث أيضّاء غالبًا ما يّنظّر إليه على أنه علامة إيجابية لرؤية تباين صغير داخل كل عينة بيانات؛ 

إذ إنه قد يشير إلى التجانس, والتشابهء والمتانة ضمن البيانات التي تم جمعها. 

- النطاق: قد يكون النطاق أبسط مقياس للتشتت. والنطاق هو الفرق بين أكبر قيمة وأصغر 
قيمة في مجموعة البيانات المعطاة sil)‏ المتغيرات). أي إننا نحسب النطاق ببساطة عن طريق 
تحديد أصغر قيمة في مجموعة البيانات (الحد الأدنى). وتحديد أكبر قيمة في مجموعة البيانات 
(الحد الأقصى). وحساب الفرق بينهما أيّ: (النطاق - الحد الأقصى - الحد الأدنى). 

- التباين: هو مقياسٌ أكثر شمولًا وتطؤرًا للتشئّت. ويُستخدّم التباين لحساب انحراف جميع نقاط 
البيانات في مجموعة البيانات المعطاة عن الوسط الحساي. وكلما كان التباين أكبر. زاد انتشار 
OBLI (cis)‏ عن الوسط وأيضًا زاد تنؤعها بالشكل الذي يسمح لأيّ شخص ملاحظته في عينة 
البيانات. ومنع اختلاط الفروق السلبية والإيجابية» يأخذ التباين مربع اللمسافات من الوسط الحسابي 
في الاعتبار. وهكن كتابة معادلة عينة البيانات كالتالي: (يتم استبدال كلّ () ب سء وكل (0) ب ن) 








حيث ن هي d usi ene‏ وس (عليها شرطة) هو الوسط الحسابي للعينة 
وس (بجوارها 1 صغيرة) هو القيمة ذات الترتيب (1) في العينة. تشير قيمٌ التباين الأكبر إلى مزيد 
من التششُت؛ في حين تشير القيم الأصغر إلى انضغاط نقاط البيانات في حزمة البيانات الكلية. 
ونظرًا لأن الفروق مربعة؛ فإن الانحرافات الأكبر عن الوسط الحساي تُسهم بشكلٍ معنوي في 
قيمة التباين. asd Eya‏ ونظرًا لأن الفروق مربعة؛ فإن الأرقام التي تمثل الانحراف/ التباين 
تصبح غير ذات معنى إلى حَدَّ ما (في مقابل الفرق بالدولارء وهنا يتم الحصول على فرق مربع 
للدولار). لذلك؛ ففي العديد من تطبيقات الأعمال لا نستخدم التباين كمقياس للتشتُت» 
ونستعيض عنه بمقياس آخر يعطي للتشئّت معنّى أفضلء ويُسمّى الانحراف المعياري. 
- الانحراف المعياري: هو أيضًا مقياسٌ لانتشار القيم ضمن مجموعة من البيانات. ويتم حسابه 
ببساطة عن طريق أخذ الجذر التربيعي للتغيرات. وتوضّح الصيغة التالية حساب الانحراف 
ا معياري من عينة معينة من نقاط البيانات: (يتم استبدال كلّ («) ب سء وكل (م) ب ن) 
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- متوسط الانحراف المطلق: إضافةً إلى التباين والانحراف ال معياري نستخدم أيضًا في بعض 
الأحيان متوسط الانحراف المطلق لقياس التشتُّت في مجموعة البيانات. وَيُعَدٌَ استخدام هذا 
المقياس طريقة أبسط لحساب الانحراف الإجمالي عن الوسط الحسابي. وعلى وجه التحديده 
يتم حساب متوسط الانحراف المطلق من خلال قياس القيم المطلقة للفروق بين كل نقطة 
من نقاط البيانات والوسط الحسايء ثم جمع تلك القيم. ويوفّر ذلك مقياسًا للانتشار دون 
أن يكون محددًا حول نقطة بيانات تكون أدنى أو أعلى من الوسط الحساي. وتوضّح الصيغة 
التالية حساب متوسط الانحراف المطلق: 
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- الربيعات والنطاق الزبيعي: تساعدنا Oleg dh‏ على تحديد الانتشار داخل مجموعة فرعية 
من البيانات. ويش كل الرُبيع ربع عدد نقاط البيانات المعطاة في مجموعة البيانات. ولتحديد 
الرُبيعات يتم أولًا ترتيب البيانات. ثم بعد ذلك يتم تقسيم تلك البيانات المرتبة إلى أربع 
مجموعات بيانات أصغر منفصلة بعضها عن بعض. وَتُعَنَ البيعات مقياسًا مفيدًا للتشئّت؛ 
لأنها - مقارنة بالمقاييس المناظرة الأخرى - أقل تأثرًا بالقيم المتطرفة أو الانحرافات في مجموعة 
البيانات بالكامل. وغالبًا ما يتم استخدام الرُبيعات كأفضل خيار لقياس التشتّت كما يتم اعتبار 
الوسيط هو مقياس التشّت الأنسب لقياس الاتجاه المركزي؟ وذلك عند التعامل مع الانحراف و/ 
أو البيانات ذات القيم المتطرفة. إِنَّ الطريقة الشائعة للتعبير عن الرُبيعات هي النطاق (S941)‏ 
الرُبيعسيء والتي تصف الفرق بين الربيع الثالث (03) والربيع الأول (01) وهذا الفرق يعطي 
V‏ على مدى النصف الأوسط من الدرجات في التوزيع. وَيُحَدُ أفضل شرح أو توضيح للمقاييس 
الوصفية المستندة على الرُبيعات (سواء كانت مقاييس مركزية أو مقاييس تشتت)» هو وجود 
ما 45,5( «popular plot‏ والذي يُطلّق عليه أيضًا .(box-and-whiskers plot) gÎ a box plot‏ 
- مُخطط الصندوق وطرفاه 9i Box-and-Whiskers Plot‏ ببساطة الرسم الصندوقي 1064م :00 8: هو 
dha guy‏ يُوضّح العديد من الإحصائيات الوصفية حول مجموعة البيانات اللعطاة. ومن 
الممكن أن يكون هذا الرسم إما أفقيًا أو رأسيّا؛ ولكن الرأسي هو التمثيل الأكثر شيوعًا؛ خاصة 
في منتجات برمجيات التحليلات الحديثة. ومن ا معروف أنَّ أول مَنْ أنشأ هذا المخطط وقدّمه 
IMP Y ele à John W. Tukey 5-2‏ الشکل ۸-۲ زوجين من dl e box plots‏ 
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cae‏ يتشاركان نفس المحور لا (أو ص على حسب الطباعة للشكل). كما هو موضح هناء 
يمكن أن يحتوي مخططاً واحداً على 16م :0ط واحداً أو أكثر لأغراض المقارنة المرئية. في مثل 
هذه الحالات؛ يكون المحور نإ (أو ص على حسب الطباعة للشكل)؛ هو المقياس الشائع للحجم 
(القيمة العددية للمتغير)» في حين يُعبّر المحور السيني (أو *) عن فئات مختلفة/ مجموعات 
فرعية مختلفة كالأبعاد الزمنية المتفاوتة (مثل: إحصائيات وصفية لنفقات الرّعاية الطبية 
السنوية في عام ١٠١۲م‏ مقابل عام ١٠١۲م)‏ أو فئات مختلفة (مثل: الإحصاء الوصفي لنفقات 
التسويق مقابل إجمالي المبيعات). وعلى الرغم من أنه تاريخيًاه لم يتم استخدام اهام ×0ط على 
نطاق واسع بما يكفي في الغالب (وخاصة في ا مناطق خارج الإحصاءات)» ومع الرّواج الحاصل 
لتحليلات الأعمال الناشئة؛ فإنه (أيّ: اهام ×0ط) يكتسب الشهرة في ال مجالات الأقل تقنيةٌ في 
عام الأعمال. ويؤدي ثراء ا معلومات الناتجة من اهام box‏ وأيصًّا سهولة فهمها إلى حَدّ كبير 
إلى زيادة الثقة فيه ورواج استخدامه في الآونة الأخيرة. يُوصح اهام ×0 المركزية (الوسيط 
وأحيانًا أيشًا الوط الحسابي)» وكذلك التششّت (كثافة البيانات ف النصف الأوسط وا مرسومة 
كصندوق بين الربعين الأول والثالث)» والحدان الأدنى والأقصى (والموضحة كخطوط ممتدة من 
الصندوق» تبدو كالشوارب» والتي يتم حسابها على أنها ١,5‏ أضعاف الطرف العلوي أو السفلي 
من الصندوق الرُبيعي) إلى جانب القيم الشاذة الأكبر من حدود الشوارب. يوضّح box plot‏ 
أيضًا ما إذا كانت البيانات مُوزَّعة بشكل متماثلٍ فيما يتعلق بالوسط الحسابي أو أنها تنمايل 
بطريقة أو بأخرى. ويعطي الموضع النسبي للوسيط مقابل الوسط الحسابي وأطوال الشعيرات 
الممتدة على جانبي الصندوق دلالةٌ جيدةً على الانحراف المحتمل في البيانات. 
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شکل ۸-۲: فهم التفاصيل عن Box-and-Whiskers cUalas‏ 


شكل التوزيع: 

على الرّغم من أنه ليس شائعًا مثل المركزية والتشتت؟ فإن شكل توزيع البيانات يُعَدْ أيضًّا مقياسًا 
مفيدًا للإحصاءات الوصفية. ولكن قبل الخوض في شكل التوزيع؛ نحتاج أولًا إلى تعريف التوزيع 
نفسه. ببساطة نقول: إِنَّ التوزيع هو تكرار نقاط البيانات التي يتم حسابها ورسمها على عدو صغيرٍ 
من العلامات الفئوية أو النطاقات العددية (أيْ: صناديق التخزين). وعند رسم التوزيع بيانيّه يعرض 
المحور ز (أو ص) التكرار (عدد أو نسبة مئوية)» في حين يعرض المحور < (أو س) الطبقات المنفردة 
أو الصناديق بنمط ترتيبي. يُسمّى التوزيع المعروف جيدًا بالتوزيع الطبيعيء والذي يتطابق تمامًا 
على كلا جانبي الوسط الحساي» ويحتوي التوزيع الطبيعي على العديد من الخصائص الرياضية التي 
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تم إنشاؤها بشكلٍ جيد والتي تجعله أداةً مفيدةً جدًّا للبحث والممارسة. وكلما زاد تشئّت مجموعة 
البيانات؟ زاد الانحراف المعياريء وكذلك يبدو شكل التوزيع أعرض. يعرض الشكل 95-7 رسماً بيانياً 
للعلاقة بين التشثّت وشكل التوزيع (وذلك في سياق الكلام عن التوزيع الطبيعي). 
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شكل 4-۲: العلاقة بين التشتت وخصائص الشكل 
يُوجّد نوعان من المقاييس الشائعة الاستخدام لحساب خصائص شكل التوزيع وهما: الانحراف 
والتفرطح. وغالبًا ما يستخدم الرسم البياني (مخطط التكرار) لتوضيح كل من الانحراف والتفرطح. 
- الانحراف: هو قِياسٌ لعدم التماثل (التمايل) في توزيع البيانات التي تصوّر هيكلاً أحاديّ الشكل 


s 


- في هذا التوزيع للبيانات تُوجَد قمة واحدة فق ط. ولأن التوزيع الطبيعي هو توزيعٌ أحاديٰ 
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الشكل متماثلٌ تمامّ؛ فلا يُوجّد به انحرافات؛ أي إِنَّ قياس الانحراف (أو قيمة معامل الانحراف) 
يساوي الصفر. ويمكن أن يكون قياس/ قيمة الانحراف إما بالموجب أو بالسالب. إذا مال التوزيع 
ناحية اليسار (أي إِنَّ الذيل على الجانب الأمن وكان الوسط الحسابي أصغر من الوسيط)؛ فإنه 
ينتج عنه مقياس انحراف موجب. أما إذا مال التوزيع ناحية اليمين (أي إِنَّ الذيل على الجانب 
الأيسر وكان الوسط الحسابي أكبر من الوسيط)؛ فعندئذ يكون الانحراف سالباً. فضي الشكل ٩-۲‏ 
يمثل المنحنى (©) توزيعًا منحرفًا Birga‏ في حين يمثل المنحنى (3) توزيعًا منحرفًا سالبًا. وفي نفس 
الشكلء يمثل كل من (2) و(0) تمائلاً مثالياً وبالتالي قياس الانحراف يساوي صفر. 
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حيث 5 هو الانحراف ا معياري» وه هي حجم العينة. 

- التفرطح: هو مقياسٌ آخر لاستخدامه في تحديد خصائص شكل التوزيع الأحادي. وبغض النظر 
عن ميل شكل التوزيع؛ فإِنَّ التفرطح أكثر اهتمامًا بتميبز طبيعة التوزيع من حيث القمة/ 
الطول/ النحافة. وبشكل أكثر تحديدًا؛ فإِنّ التفرطح يقيس درجة ارتفاع أو انخفاض قمة 
التوزيع عنها في التوزيع الطبيعي. في حين يشير التفرطح الموج ب إلى توزيع مدبب/ طويل 
e a‏ ويشير التفرطح السّلبي إلى توزيع مسطح/ قصير نسبيًا. وكنقطة مرجعية؛ فإن التوزيع 
الطبيعي له تفرطح . ويمكن كتابة معادلة التفرطح كالتالي: 








إِنّْ الإحصائيات الوصفية (شأنها شأن الإحصائيات الاستنتاجية) يمكن حسابها بسهولة؛ 
وذلك باستخدام حزم برمجية إحصائية ذات جدوى تجارية (مثل: 585 أو 25255 
gf (Statistica gf JMP sÍ Minitab gf‏ البرامج المجانية/ المفتوحة (مثل: ii hll Jeg (R‏ 
الأكثر ملاءمةً لحساب الإحصائيات الوصفية, وبعض الإحصائيات الاستنتاجية هو استخدام 
جداول الإكسل. وتوضّح الفكرة التقنية ؟-1 بالتفصيل كيفية اس تخدام جداول مايكروسوفت 
إكسل لحساب الإحصائيات الوصفية. 
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رؤية فنية ؟-١‏ 

كيفية حساب الإحصائيات الوصفية باستخدام جداول مايكروسوفت إكسل 

يمكن القول بأن برنامج إكسل يُعَنُ أداة تحليل البيانات الأكثر شيوعًا في العالم, كما 
يمكن استخدامه بسهولة بالنسبة للإحصاءات الوصفية. وعلى الرغم من أن التكوين 
الأماسي لبرنامج إكسل لا يُوحي أن به دوال إحصائية متاحة للمستخدمين النهائيين؛ 
فإنَّ هذه الدوال يمكن تثبيتها وتنشيطها (عند التشغيل) بالقليل فقط من نقرات 
الماوس. ويوضّح الشكل ٠١-١‏ كيفية تنشيط هذه الدوال الإحصائية (كجزءِ من تحليل 
عل10018) في مايكروسوفت إكسل 175١7م.‏ 





Quick Access Toolbar 














Analysis TooIPaK - VEA. 
"^| Anatytie Sotver Pat oem. 
IM] Euro Curren«r Tools 
Schrer Add-m. 





| ara Analysis Tools 
Tools for financial and scientific data 
D E F analysis. 
i [à FUMCRES.XLAM 
! Tell me mare. 











شكل :٠١-7‏ تفعيل الدوال الإحصائية في إكسل ٠١١5‏ 


ذكاء الأعمال والتحليلات وعلم البيانات. منظور إداري 


NEA 


التحليلات الوصفية :)١(‏ طبيعة البيانات» النمذجة الإحصائية, تصوير البيانات 


وبمجرد تفعيل الدوال الإحصائية؛ سيظهر تحليل 1001281 في خيار قانمة البيانات 
C 53 (Data)‏ اسم تحليل البيانات äl ueg (Data Analysis)‏ فوق dda”‏ 
البيانات Ale cao "(Analysis) 5l Jdal” egare ĝ “(Data Analysis) sl‏ 
التبويب ”البيانات أو Jas à ($ " (Data)‏ قوائم إكسلء ستشاهد ”الإحصائيات الوصفية 
أو Statistics)‏ ciptiveءDe)“‏ كأحد الخيارات الموجودة ضمن قانمة أدوات تحليل 
البيانات (انظر: الشكل .1١-7‏ الخطوات ١[‏ و8])؛ انقر فوق ”موافق أو 010)", 
وسيظهر مربع حوار بعنوان ”الإحصائيات الوصفية (5]2)15]15 ع#اتاملىو»12)“ (انظر: 
منتصف الشكل .)١١-19‏ في مربع الحوار هذا؛ تحتاج إلى إدخال نطاق البيانات» والتي 
يمكن أن يتم تمثيلها بواحدٍ أو أكثر من الأعمدة الرقمية: إلى جانب مربعات فحص 
التفضيلات. وانقر فوق 016 (انظر: الشكل 1١-7‏ الخطوات ١[‏ وع]). إذا تمّ تظليل 
(دهناء»5»1) أكثر من عمود رقمي واحد؛ فستقوم الأداة بمعالجة كل عمود على أنه 
مجموعة بيانات منفصلةء ومن ثم ستُقدم إحصائيات وصفية لكل عمود على Báo‏ 










aia 
nama anem 
Sama nonae 
eren te 
Án 
im — 


سباع فهر هلام 9 وم 65 596 














شكل :1١-7‏ الحصول على الإحصائيات الوصفية في برنامج إكسل 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري yes‏ 


الفصل الثاني 


: وكمثالٍ بسيط اخترنا عمودين (تمّ وَضْع عنوانين لهما: مصاريف وطلبات) 
i—i sjal gög (Descriptive Statistics) (4:55)! «Lael juo. GXàss‏ 
من الشكل ١١-7‏ المخرجات التي تم إنشاؤها بواسطة إكسل. وكما يتضح؛ أنتج 
إكسل جميع الإحصائيات الوصفية التي تمت تغطيتها في القسم السابق: وإضافة 
المزيد منها إلى القائمة. وفي إكسل ١11‏ "م من السهل جدًا أيضًا (بقليلٍ من نقرات 
الماوس) أن يتم ]25 GS. .a box-and-whiskers eL‏ يُوضُح الشكل 17-7 العملية 
البسيطة و مكونة من ثلاث خطوات لإنشاء d$] ( abox-and-whiskers‏ 
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وعلى الرغم من أنَّ هذه الأداة تُعَدُ مفيدةً جدًا في إكسل؛ فإنه يتحتّم على 
المحلّل أن يكون ملمًّا بنقطة مهمة تتعلق بالنتائج المتحصّل عليها بواسطة تحليل 
 ToolPak‏ والتي تنتهج سلوكًا مختلقًا عن وظائف الإكسل الأخرى المعتادة. 
وعلى الرغم من أن وظائف إكسل تتغيّر ديناميكيًا مثلما تتغيّر البيانات الأساسية 
في جدول البيانات؛ فإنه لا يتم تغيير النتائج التي تم إنشاؤها بواسطة تحليل 
عل001. وعلى سبيل المثال: إذا aas‏ بتغيير القيم في أيٍّ من هذين العمودين 
أو كليهما؛ فس تبقى نتائج الإحصائيات الوصفية التي أنتجها تحليل ع1ه10012' 
كما هي دون تغيير. ومع ذلك؛ لا ينطبق الأمر نفسه على وظائف إكسل المعتادة. 
إذا كنتَ قد قمتّ بحساب قيمة الوسط الحسابي لعمود ما (باستخدام الدالة 
(AVEREGE‏ للنطاق من (41:4121). ثم قمتّ بتغيير القيم داخل نطاق 
البيانات؛ فسوف تتغير قيمة الوسط الحسابي تلقائيًا. أي إنه باختصار, لا تحتوي 
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النتائج التي ينتجها تحليل عله10015 على رابط ديناميي للبيانات الأساسية؛ وإذا 
تم تغيير أيّ بيان؛ فيجب إعادة التحليل مرةٌ أخرى باستخدام مربع الحوار. 

تغطي التطبيقات الناجحة لتحليلات البيانات نطاقًا واسعًا من إعدادات 
الأعمال والتنظيمات» ومعالجة المشكلات التي كان يُعتقد في السابق أنها غير قابلة 
للحل. وتمثل الحالة العملية ۲٠۳‏ مثالا ممتارًا لهذه القصص الناجحة؛ إِذ تتبَنّى 
إدارة بلدية صغيرة منهج تحليل البيانات لكشف وحل المشكلات بذكاء من خلال 
bl Jalos‏ الطلب والاستهلاك بشكلٍ مستمر. 


حالة عملية ۳-۲ 
مدينة كاري تستخدم التحليلات لتحليل البيانات من أجهزة الاستشعار, وتقييم الطلب 
والكشف عن المشكلات 

ِنَّ تسرب المياه من الحنفيات, والخلل بغسالة الصحون» وطفايات الحريق المكسورة؛ 
تُعَدَُ من أكثر المشكلات المؤرقة لأَيّ مالك منزل أو ممارس لأع مال تجارية إلى أن يتم 
إصلاحها. وهذه المشكلات قد تكون مكلفةً ولا يممكن التنبؤ بهاء وللأسفء يكون من 
الصعب تحديدهها. وقد تمّ تسهيل عملية اكتشاف وإصلاح المشكلات التي تؤدي إلى 
نقصان أو فقدان الماء في مدينة كاري بشمال كارولينا؛ وذلك من خلال مجموعة من 
عدّادات اطياه اللاسلكية وبوابة إلكترونية معتمدة على البيانات يسهل الوصول إليها 
بواسطة جميع العملاء. في هذه العملية. حصلت المدينة على رؤية ذات صورة كبيرة 
عن حساسية استخداع المياه؛ وذلك لتخطيط التوسّعات في محطات اطياه المستقبلية, 
وتعزيز جهود الصيانة المُستّهدّفة. عندما قامت مدينة كاري بتثبيت العدّادات اللاسلكية 
لعدد 7٠٠٠١‏ مشترك في eY- Ae ple‏ علمت إدارة البلدة أن التقنية الجديدة لن تقتصر 
على توفير امال عن طريق إزالة القراءات الشهرية يدويا؛ بل أدركت المدينة أيضًَا أنها 
ستحصل على معلومات أكثر دقةٌ وفي الوقت المناسب حول استهلاك اللياه. يقرأ النظام 
اللاملكي :461351 العدّادات مرةّ واحدة كلّ ساعة؛ مما يعني الحصول على 41١‏ 
نقطة بيانات لكلّ عميلٍ كل عام بدلا من قراءة شهرية واحدة. ما يعني 17 نقطة بيانات 
فقط لكل عميل على مدار العام. كان للبيانات قدرات هائلة» إذا كان من الممكن 
الحصول عليها وتحليلها بسهولة. يقول المدير اطالي لإدارة بلدة كاري كارن ميلز: ol»‏ 
القراءات الشهرية لعدادات المياه تشبه الحصول على جالون من بيانات المياه المهمة. أمّا 
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القراءة كل ساعة للعدادات فتشبه إلى حَدَّ كبير الحصول على حمام سباحة من الحجم 
الأولمبي مملوء بالبيانات. كما يساعدنا برنامج 545 في إدارة حجم تلك البيانات بشكل 
رائع“. في الواقع؛ فإن هذا الحل يكن إدارة المدينة من تحليل عدد نصف مليار نقطة 
بيانات تخ استخدام امياه وجعلها متاحة وسهلةً الاستخدام لجميع العملاء. 

إن القراءة المباشرة كلّ ساعة للعدَّادات سوء المنزلية أو التجارية أنتجت بعض 
التطبيقات العملية جد وهي: 

- هكن لإدارة البلدة إخطار العملاء بأيّ تسريبات مُحتمَّلة في غضون أيام. 

- يمكن للعملاء å‏ تنبيهات تخطرهم في غضون ساعات بوجود ارتفاع في استخدام المياه. 

- يمكن للعملاء مراقبة معدّلات استهلاكهم للمياه عبر الإنترنت؛ مما يساعدهم على 
المبادرة في الحفاظ على اطيأه. 

من خلال البوابة الإلكترونية؛ شهدت إحدى المؤسسات التجارية في مدينة كاري 
ارتفاعًا حادًا في استهلاك المياه في عطلات نهاية الأسبوع في الوقت الذي يقضي فيه 
الموظفون تلك العطلات خارج المدينة. كان ذلك أمرًا غريبًا ومُلفئّه ولكن القراءة غير 
العادية للعدّادات ساعدت الشركة على اكتشاف خلل في غسالة الصحون التجارية؛ مما 
يجعلها تعمل بشكلٍ مستمر خلال عطلة نهاية الأسبوع. وبدون بيانات عدادات oL‏ 
اللاسلكية والبوابة الإلكترونية المتاحة للعملاء. كان من الممكن أن تحدث هذه المشكلة 
دون أن يلاحظها أحدٌ؛ مما يؤدي إلى استمرار إهدار الماء والمال. 

استخدام تلك البوابة الإلكترونية أعطى المدينة رؤيةٌ أكثر دقةٌ عن الاستخدام اليومي 
للمياه لكلّ شخص.ء وهو أمرٌ حساسٌُ في التخطيط للتوشّعات المستقبلية في منشآت 
المياه. ولعل الميزة الأكثر a)‏ للانتباه هي أن المدينة تمَكّتّت من التحقّق من ls yl‏ 
كان له تأثي بعيد المدى على تكاليف فروع الشركة المختلفة. ألا وهو أن سكان كاري 
اقتصاديون جدًا في استخدامهم للمياه. وتقول مديرة المموارد المائية في المدينة ليلى 
جودوين: ”إننا نقوم بحساب ذلك باستخدام أجهزة حديثة ذات كفاءة عالية وهكن 
أن يصل استخدام الطياه في الأماكن ا مغلقة إلى ٠١‏ جالونًا لكل شخص في اليوم الواحد. في 
حين يبلغ معدل استخدام سكان كاري 60 جالونًاء وهو لا يزال يُعَذٌ معدلًا منخفضًا إلى 
Sae I dal lU, es do‏ كانت المدينة تنفق الأموال لتشجيع ترشيد استخدام 
olabil‏ مثل: تقديم خصومات على ال مراحيض المنخفضة التدفق أو عمل تخفيضات على 
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براميل الأمطار. والآن يمكن اتخاذ نهج أكثر استهدافًاء ومساعدة مستهلكين مُحدّدين 
على فهم وإدارة استخدام المياه سواء في الأماكن المغلقة أو المفتوحة. 

مم يكن برنامج 545 على قدرٍ من الأهمية لتمكين السكان من فهم استخدامهم 
للمیاه فحسب؛ ولکنه أيضًا لعب دورًا خفيًا لربط قاعدت بيانات متباينتين. يقول ميلز: 
”لدينا قاعدة بيانات للفواتير وقاعدة بيانات أخرى لقراءة العدادات. لقد كنا في حاجة 
إلى تطويرهما معًا وجعلهما قابلتين للتطبيق”. 

وتَّقدَّر إدارة المدينة أنه بمجرد إزالة الحاجة للقراءات اليدوية؛ سيوفر Aquastar ell‏ 
أكثر من ٠١‏ مليون دولار فوق تكلفة المشروع. ولكن يمكن أن يوفر مكوّن التحليلات 
وفورات أكبر. وبالفعل؛ فقد استطاع كلّ من المدينة والمواطنين الأفراد توفير قدرٍ من امال 
عن طريق الاكتشاف المبكر لتسرّب المياه. وبينما تمضي قُدُما في تخطيط احتياجات البنية 
التحتية المستقبلية؛ فإن حصول مدينة كاري على معلومات دقيقة حول استخدام المياه 
سيساعدها على الاستثمار في العدد الصحيح من البنية التحتية في الوقت المناسب. وإضافةٌ 
إلى ذلك؛ فإن فهم استخدام المياه سيساعد المدينة إذا لحق بها شيءٌ ضار مثل الجفاف. 

تقول لیلی جودوین: ”لقد مررنا بالجفاف فی عام ۲۰۰۷م وإذا حدث هذا مر 
أخرى» فلدينا خطة لاستخدام بيانات 40025]26؛ لمعرفة كمية اممياه التي نستخدمها 
على أساس يومي والتواصل مع العملاء. يمكننا عرض ما يحدث هناء وإليك عزيزي 
ا مواطن المقدار الذي يمكنك استخدامه حال انخفاض منس وب الماء لدينا. ونأمل 
ألا نضطر أبدًا إلى استخدام ذلك؛ لكن علينا أن نكون على استعداد دائم». 

أسئلة للمناقشة: 

-١‏ ما التحديات التي كانت تواجهها مدينة كاري؟ 

-Y‏ ما الحل الذي تم اقتراحه؟ 

-٠‏ ماذا كانت النتائج؟ 

ع- ما المشكلات الأخرى وحلول تحليل البيانات التي تتوقعها لمدن مثل كاري؟ 
Source: "Municipality puts wireless water meter-reading data to work (SAS*‏ 
Analytics) - The Town of Cary, North Carolina uses SAS Analytics to analyze‏ 
data from wireless water meters, assess demand, detect problems and engage‏ 


customers.” Copyright © 2016 SAS Institute Inc., Cary, NC, USA. Reprinted 


with permission. All rights reserved. 
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أسئلة مراجعة على القسم :0-Y‏ 

-١‏ ما العلاقة بين الإحصاءات وتحليلات الأعمال؟ 

La -Y‏ الفروق الأساسية بين الإحصاء الوصفي والاستنتاجي؟ 

*- اذكر وعرّف باختصار مقاييس النزعة المركزية للإحصاءات الوصفية. 

-٤‏ اذكر وعرّف باختصار مقاييس التشئّت للإحصاءات الوصفية. 

-٥‏ ما هو مخطط الصندوق وطرفيه؟ وما هي أنواع المعلومات الإحصائية التي يمثلها؟ 
1- ما هي خصائص الشكل الأكثر شيوعًا لوصف توزيع البيانات؟ 


1-۲ نمذجة الانحدار للإحصاءات الاستدلالية: 

Le‏ يكون الانحدار - وخاصةً الانحدار الخطي - هو أوسع تقنيات التحليلات شهرةً وأكثرها 
استخدامًا في الإحصاءات. وتعود جذور الانحدار تاريخيًا إلى عشرينيات وثلاثينيات القرن العشرين» 
والتي colo‏ بالعمل المبكر على الخصائص الموروثة للبازلاء الحلوة من قبل السّير فرانسيس جالتون 
ومن بعده كارل بيرسون. ومنذ ذلك الحين؛ أصبح الانحدار هو التقنية الإحصائية لتوصيف 
العلاقات بين المتغير/ المتغيرات التفسيرية (مدخلات) ومتغير/ متغيرات الاستجابة (مُخرجات). 

كما هو الحال في الأساس؛ فإن الانحدار هو تقنية إحصائية بسيطة نسبيًا لنمذجة تبعية متغير 
(الاستجابة أو المخرجات) إلى متغيّر تفسيري واحد أو أكثر (مدخلات). وبمجرد تحديدها؛ يمكن تمثيل 
هذه العلاقة بين المتغيرات بشكل رسمي على أنها دالة خطية/ مضافة أو على أنها معادلة خطية/ مضافة. 
وكما هو الحال مع العديد من تقنيات النمذجة الأخرى؛ يهدف الانحدارٌ إلى التعرّف على العلاقة الدالية 
في ما بين خصائص العام الحقيقي ووصف هذه العلاقة بنموذج رياضيء والذي قد يُستَخدّم بعد ذلك 
لكشف وفهم تعقيدات الواقع واستكشاف وشرح العلاقات أو التنبؤ بالحوادث المستقبلية. 

ويمكن استخدام الانحدار لواحد من غرضين: الأول هو اختبار فرضية أو استقصاء العلاقات 
المحتملة بين المتغيرات المختلفة: والثاني تقدير التنبؤ بقيم متغيرات الاستجابة atia qe Sl‏ 
تفسيري واحد أو أكثر. ولا يقوم أحد هذين الاستخدامين مقام الآخر؟ إذ تُعَذُ القوة التفسيرية 
للانحدار هي LAÍ‏ الأماس لقدرتها على التنبؤ. ففي اختبار الفرضية (بناء النظرية)؛ يمكن أن 
يكشف تحليل الانحدار عن وجود/ قوة واتجاهات العلاقات بين عدد من اللتغيّرات التفسيرية 
x jay Sale l 25)‏ «أو س») ومتغير الاستجابة (ويرمز له عادة بالرمز ر «أو ص»). أما 
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في التنبؤ؛ فيُحدَّد الانحدار العلاقات الرياضية المضافة (في شكل معادلة) بين واحدٍ أو أكثر من 

المتغيرات التفسيرية ومتغير الاستجابة. وبمجرد تحديد هذه المعادلة؛ يكون من الممكن استخدامها 

للتنبؤ بقيم متغير الاستجابة لمجموعة معينة من قيم المتغيرات التفسيرية. 

- الارتباط مقابل الانحدار: ولأن تحليل الانحدار نشأ من دراسات الارتباطء ولأن كلتا الطريقتين 
تحاولان وصف العلاقة بين متغيرين (أو أكثر)؛ فإن هذين المصطلحين غالبًا ما يتم الخلط بينهما من 
قبل المتخصصين وحتى العلماء. لا يضع الارتباط افتراضاً بديهياً لتبعية أحد اللتغيرات بلتغير آخر من 
عدمه. كما لا يهتم بالعلاقة بين المتخيرات؛ ولكنه بدلا من ذلك يُعطي تقديرًا على درجة الارتباط بين 
المتغيرات. وعلى الجانب الآخر؛ يحاول الانحدارٌ أن يَصف تبعية متغير الاستجابة لواحدٍ (أو أكثر) 
من المتغيرات التفسيرية؛ إذ يفترض ضمنيًا أن هناك تأثيراً سببياً أحادي الاتجاه من المتغير التفسيري 
gl)‏ المتغيرات التفسيرية) إلى متغير الاستجابة» بغض النظر عمًا إذا كان مسار التأثير مباشرًا أو غير 
مباشر. أيضًا وعلى الرغم من أنَّ الارتباط يهتم بالعلاقات ذات المستوى المنخفض بين متغيرين؛ فإن 
الانحدار يختضٌ بالعلاقات بين جميع المتغيرات التفسيرية ومتغير الاستجابة. 

- الانحدار البسيط مقابل الانحدار المتعدد: إذا تمّ بناء معادلة الانحدار بين متغير استجابة واحد 
ومتغير تفسيري واحد؛ عندئذ يُطلق عليه الانحدار البسيط. فعلى سبيل المثال: Dolea A‏ 
الانعدار التي بُنيّت بغرض توقع/ شرح العلاقة بين طول شخص (التغير التفسيري) ووزنه 
(متغير الاستجابة) مثالا جيدًا على الانحدار البسيط. أمّا الانحدار المتعدد: هو امتدادٌ للانحدار 
البسيط؛ إذ تكون المتغيّرات التفسيرية أكثر من واحد (أو) أكثر من متغير. فعلى سبيل المثال» 
ds‏ نفس اللثال السابق: إذا كنا لن نعتمد فقط على طول الشخص للتنبؤ بوزنه بل سنأخذ أيضاً 
في الاعتبار الخصائص الشخصية الأخرى (مثل: مؤشر مجموعة الجسم. الجنسء العرق) فإننا 
في هذه الحالة سنقوم بإجراء تحليل الانحدار المتعدد. وفي كلتا الحالتين؛ تكون العلاقة بين 
متغير الاستجابة والمتغير التفسيري (المتغيرات التفسيرية) علاقة خطية ومضافة بالطبيعة. US]‏ 
إذا كانت العلاقات غير خطية؛ فقد نحتاج إلى استخدام واحد من العديد من طرق الانحدار غير 
الخطية الأخرى؛ للوصول بصورة أفضل للعلاقات بين متغيرات المدخلات والمخرجات. 

كيف نطوّر نموذج الانحدار الخطي؟ 

لفهم العلاقة بين متغيرين؛ فإن أبسط شيءٍ يمكن القيام به هو رسم مخطط تبعثر؛ إذ يمثل 


المحور لإ (أو ص) قيم متغير الاستجابة» ويمثل المحور ‏ (أو س) قيم المتغير التفسيري (انظر: 
الشكل 1-7). سيقوم مخطط التبعثر بإظهار التغيّرات في متغير الاستجابة كدالة للتغيرات في 
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المتغير التفسيري. يُوضّح الشكل 17-7 وجود علاقة طردية بين الاثنين؛ فكلما زادت قيم المتغير 
التفسيري؛ زادت قيم متغير الاستجابة. 














× . المتغير التفسيري 
شکل ۲-۱۳: مخطط تبعثر وخط انحدار خطي 

يهدف تحليل الانحدار البسيط إلى إيجاد تمثيلٍ رياضي لهذه العلاقة. وفي الواقع؛ فهو يحاول 
العثور على أي دلالة ملرور خط مستقيم بشكلٍ صحيح بين النقاط المرسومة (والتي تمثل البيانات 
التاريخية/ الملاحظة) بطريقة تقلل من المسافة بين النقاط والخط (القيم المتوقعة على خط 
الانحدار النظري). وعلى الرغم من وجود عدة طرق/ خوارزميات مقترحة لتحديد خط الانحدار؛ 
فإن الطريقة الأكثر شيوعًا في الاستخدام تُسمّى طريقة المربعات الصغرى العادية (OLS)‏ تهدف 
طريقة 01:5 إلى تخفيض مجموع المربعات المتبقية (تربيع المسافات الرأسية بين الملاحظة ونقطة 
الانحدار) وتؤدي إلى تعبير رياضي للقيمة التقديرية لخط الانحدار (والتي تُعرف باسم معلمات 
(b‏ وبالنسبة للانحدار الخطي البسيط؛ يمكن إظهار العلاقة المذكورة أعلاه بين متغير الاستجابة 
() وا متغير التفسيري (*) كمعادلة بسيطة كما يلي: 





X =B, + Bx 


في هذه المعادلة؛ يُسمّى (80) التقاطع. ويُسمّى (81) الميل. وبمجرد أن تقوم 01:5 بتحديد 
قيم هذين المعاملين؛ يكون من الممكن استخدامٌ ا معادلة البسيطة للتنبؤ بقيم لإ من قيم ‏ المعطاة. 
وتكشف العلامة وقيمة (81) أيضًا اتجاه وقوة العلاقة بين كلا المتغيرين. إذا كان النموذج من 
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نوع انحدار خطي متعدد؛ فسيستلزم الأمر تحديد مزيدٍ من المعاملات؛ بحيث يكون هناك معاملٌ 
Šolo‏ لكلّ متغير تفسيري إضافي. وكما توضّح الصيغة التالية؛ سوف يتم ضرب المتغير التفسيري 
الإضافي مع معاملات (81) الجديدة ويتم جمعها EE‏ لإنشاء تمثيل جمعي خطي طتغير الاستجابة. 


y= 8B, + AF, + Bx, + Bx, + ...+ Bz, 

كيف نعرف ما إذا كان النموذجٌ جيدًا بما فيه الكفاية؟ 
لعدة أسباب متنوعة لا تمثل النماذج في بعض الأحيان الواقع بصورة جيدة وبغض النظر 
عن عدد المتغيرات التفسيرية امُستَخدّمة في النموذج. دايا هناك إمكانية للحصول على نماذج 
بجودة منخفضة. وبالتالي يجب تقييم نموذج الانحدار الخطي وفقاً لمدى ملاءمته (الدرجة التي 
يمثل بها متغير الاستجابة). بشكل مُبِسَّط؛ ينتج عن نموذج الانحدار المناسب قيم تنبؤٌ تكون 
قريبةٌ من القيم الحقيقية التي تَنّت ملاحظتها في الواقع. وبالنسبة للتقييم الرقمي؛ غالبًا ما يتم 
استخدام ثلاثة مقاييس إحصائية في تقييم ملاءمة نموذج الانحدار. ۸۲ (۸ - تربيع)» واختبار F‏ 
الشاملء وخطأ الجذر التربيعي للوسط الحسابي (RMSE)‏ تستندُ هذه المقاييس الثلاثة جميعًا 
على مجموع أخطاء ا مربع (كم تبعد البيانات عن الوسط الحسابي» وكم تبعد البيانات عن القيم 
المتوقعة للنموذج). وتعمل توليفات مختلفة من هاتين القيمتين على توفير معلومات مختلفة 

حول كيفية مقارنة نموذج الانحدار مع نموذج الوسط الحسابي. 
من بين تلك المقاييس الثلاثة. يحتوي 82 على المعنى الأكثر فائدةً وفهمًا بسبب كونه مقياسًا 
بديهيًا. تتراوح قيمة *8 من صفر إلى واحد (المقابل للقدار التباين الذي يظهر كنسبة مئوية)؛ إذ 
يشير ”الصفر“ إلى أن العلاقة وقوة التنبق الخاصة بالنموذج المقترح ليست جيدةٌ؛ في حين يُعبّر 
«الواحد» عن أن النموذج المقترح مناسبٌ تمامًا وينتج توقعات دقيقة (وهذا لايحدث في الواقع 
مطلقاً). وعادةً ما تكون قيم “1 الجيدة قريبةٌ من الواحد الصحيح» وهذا القرب هو أساس 
الظاهرة التي تم ممذجتها؛ بحيث إذا كانت قيمة 0.3 = ”۸ لنموذج الانحدار الخطي في العلوم 
الاجتماعية؛ فيمكن اعتبار هذه القيمة جيدة بما فيه الكفاية. أما إذا كانت قيمة 0.7 = È R?‏ 
العلوم الهندسية؛ فهذه القيمة iulio A$ Y‏ بدرجة كافية. ويمكن تحقيق التحسّن في نموذج 
الانحدار عن طريق إضافة متغيرات تفسيرية متسقة» أو استبعاد بعض المتغيرات خارج النموذج» 
أو استخدام تقنيات تحويل بيانات مختلفة؛ مما يؤدي إلى زيادات نسبية في قيمة *8. ويوضح 
الشكل ٠١-١‏ عملية تدفق لتطوير نماذج الانحدار. وكما يتبيّنَ من عملية التدفق؛ فإنَّ مهمة 
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تطوير النموذج لابد أن تتبعها مهمة تقييم النموذج؛ إذ لا يقتصر S‏ على ملاءمة النموذج 
الذي تم تقييمه فقط؛ ولكن بسبب الافتراضات التقييدية التي يتعيّن على النماذج الخطية الالتزام 
بهاء كما يجب وضع صلاحية النموذج تحت المجهر. 
































شكل 16-1: عملية تدفق تطوير نماذج الانحدار 


ما أهم الافتراضات في الانحدار الخطي؟ 

على الرغم من أنه لا يزال هناك اختيارٌ بين العديد من تحليلات البيانات (سواء لأغراض 
di su‏ أو لأغراض النمذجة التنبؤية) فإنَّ نماذج الانحدار الخطي تعاني من عدة افتراضات 
شديدة التقييد. وتعتمد صلاحية النموذج الخطي المبني على قدرته على الالتزام بهذه الافتراضات. 
ونعرض فيما يلي أكثر تلك الافتراضات وضوحًا:ٍ 
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-١‏ الخطية: ينص هذا الافتراض على أن العلاقة بين متغير الاستجابة والمتغيرات التفسيرية هي 
علاقةٌ خطية. مما يعني أن القيمة المتوقعة لمتغير الاستجابة؛ هي hò ilo‏ مستقيم لكلّ 
متغير تفسيريء مع تثبيت جميع المتغيرات التفسيرية الأخرى. وكذلك لا يعتمد ميل الخط 
على قيم المتغيرات الأخرى. ويعني أيضًا أن تأثيرات المتغيرات التفسيرية المختلفة على القيمة 
المتوقعة لمتغير الاستجابة؛ هي تأثيرات مضافة بطبيعتها. 

"- الاستقلالية (للأخطاء): وينصٌ هذا الافتراضُ على أن أخطاء متغير الاستجابة غير مترابطة 
بعضها مع بعض. استقلال الأخطاء أضعف من الاستقلال الإحصائي الفعلي. وهو حالة أقوى 
وغالبًا لا يكون هناك لتحليل الانحدار الخطي. 

*- الطبيعية (للأخطاء): وينصٌ هذا الافتراضُ على أن أخطاء متغير الاستجابة تتوزّع 
توزيعًا طبيعيا؛ أيْ إنه من المفتتض أن تكون عشوائيةً تمامًا ويجب ألا تمثل أيّ أنماط 
غير عشوائية. 

ع- التباين الثابت (للأخطاء): وهذا الافتراضء والذي يُطلّق عليه أحيانًا (التفاوت المتماثل)» نص 
على أن متغيرات الاستجابة يكون لها نفس التباين في خطأهاء بغض النظر عن قيم المتغيرات 
التفسيرية. وعمليَا؛ لا يكون هذا الافتراض صالحًا إذا اختلف متغيرٌ الاستجابة على نطاق/ 
مقياس واسع با فيه الكفاية. 

- الخطية المتعدّدة: وينصٌ هذا الافتراض على عدم وجود ارتباط بين المتغيرات التفسورية (أَيْ: 
إنها لا تكرر نفس النتيجة؛ ولكنها تقدّم المعلومات المطلوبة للنموذج من منظورٍ مختلف). 
ويمكن تطبيق الخطية المتعددة من خلال تضمين النموذج متغيرين أو أكثر من اللتغيرات 
التفسيرية La za sso‏ تام (فمثلًا: إذا تمّ تضمينُ نفس المتغير التفسيري عن طريق 
الخطأً في نفس النموذج مرتينء أو مرةً واحدةً مع تحؤل طفيف من نفس المتغير). la Bale‏ 
يتم اكتشاف هذا الخطأ بواسطة تقييم البيانات المعتمد على الارتباط. 
هناك تقنيات إحصائية تمّ تطويرها تعمل على كسر هذه الافتراضات والتقنيات للتخفيف 

من أثرها. إن الجزء الأكثر أهميةً بالنسبة لممصمّم النماذج هو أن يكون على دراية بوجود وسائل 

تقييم تلك النماذجء وأن يتم وَضْع تلك الوسائل للتأكد من أن النماذج متوافقة مع الافتراضات 

التي يتم بناؤها وفقاً لها. 
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الانحدار اللوجستي: 

يُعرّف الانحدارٌ اللوجستي على أنه خوارزمية تصنيفء لها دلالة إحصائيةء مستندة على 
الاحتمالية والتي تستخدم تعلّماً خاضعاً للإشراف. وقد تم تطويره في أربعينيات القرن العشرين 
كمتمم JS)‏ من طريقة تحليل الانحدار الخطي وطريقة التمايز الخطي. وقد تمّ استخدامه على 
نطاق gl‏ في العديد من التخصّصات» ها في ذلك مجالات العلوم الطبية والاجتماعية. aling‏ 
الانحدار اللوجستي مع الانحدار الخطي في كونه يهدف كذلك إلى الاعتماد على الدالة الرياضية 
التي تشرح العلاقة بين متغير الاستجابة والمتغيرات التفسيرية باستخدام عينة من الملاحظات 
السابقة (بيانات التدريب). ولكنهما يختلفان في نقطة أساسية واحدة: وهي أن مُخرجات 
الانحدار اللوجستي (متغير الاستجابة) تكون فئة في حين تكون مخرجات الانحدار الخطي متغيراً 
La;‏ بمعنى أنه في الوقت الذي يُستَخدّم فيه الانحدارٌ الخطي لتقدير متغير رقمي مستمر؛ 
يُستخدم الانحدارٌ اللوجستي لتصنيف متغير فئوي. وعلى الرّغم من أن الشكل الأصلي من 
الانحدار اللوجستي قد تمّ تطويره إلى متغير مخرجات ثنائي (مثل: .٠ /١‏ نعم/ لاء ناجح/ راسب» 
قبول/ رفض)؛ فإن النسخة المعدَّلة في الوقت الحاضر قادرةٌ على التنبؤ بمتغيرات مخرجات متعددة 
الفئات (أيْ: الانحدار اللوجستي المتعدد الحدود). أمَّا إذا كان هناك متغيرٌ تنبؤ واحد. ومتغير 
توفع واحد؛ فشُسمّى الطريقة هنا الانحدارٌ اللوجستي البسيط (وهي مشابهةٌ لطرق استدعاء 
es‏ الانحدار الخطي مع متغير مستقل واحد فقط كانحدار خطي بسيط). 

في التحليلات التنبؤية؛ يتم استخدامٌ نماذج الانحدار اللوجستي لتطوير نماذج احتمالية بين 
واحد أو أكثر من المتغيرات التفسيرية/ التوقعية (والتي قد تكون مزيجّا من S‏ من الطبيعة 
المستمرة والفئوية) ومتغير التصنيف/ الاستجابة (والذي قد يكون ثنائياً, ذا حدين أو متعدد 
الحدود/ متعدد الفئات). وعلى عكس الانحدار الخطي الاعتيادي؛ يتم استخدام الانحدار 
اللوجستي؛ للتنبؤ بنتائج فئوية (غالبًا ما تكون ثنائية) لمتغير الاستجابة - معالجة متغير الاستجابة 
كنتيجة لتجربة garol jaN poi UU Bernoulli‏ بأخذ اللوغاريتم الطبيعي 
لاحتمالات متغير الاستجابة لإنشاء معيار مستمر كنسخة محؤلة لمتغير الاستجابة. وبالتالي يُشار 
إلى تحويل )1081 على أنه دالة الربط في الانحدار اللوجستي - وعلى الرغم من أن متغير الاستجابة 
في الانحدار اللوجستي؛ هو متغيرٌ فئوي أو ثنائي؛ فإن غ1ع10 هو المعيازٌ المستمر الذي يتم على 
أساسه الانحدار الخطي. ويوضّح الشكل 10-7 دالةً الانحدار اللوجستي؛ إذ يتم ats‏ الاحتمالات 
في ا محور × (أو س) (دالة خطية للمتغيرات المستقلة). في حين تظهر النتيجة الاحتمالية في المحور 
y‏ (أو ص) (أيْ: تتراوح قيم متغير الاستجابة بين .)١9 ٠‏ 
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شكل -10: الدالة اللوجستية 


عد الدالة اللوجسستية. ,(0) في الشكل ۲-٠١‏ هي صميم الانحدار اللوجستيء والذي لا هكن أن 
يأخذ سوى القيم بين الصفر والواحد الصحيح. وتُعَنُ المعادلة التالية تمثيًا رياضيًا مبسطًا لهذه الدالة: 














يتم Šole‏ تقديرٌ معاملات الانحدار اللوجستي (ءط ))1٠‏ باستخدام الطريقة القصوى لتقدير 
الاحتمالية. وعلى عكس الانحدار الخطي مع البواقي الموزعة توزيعًا طبيعيًا؛ فإنه ليس من الممكن 
العثورٌ على مصطلح مغلق لقيم الممُعامل التي تعظم دالة الاحتمال؛ ولذا ينبغي استخدامٌ عملية 
تكرارية بدلًا من ذلك. تبدأ هذه العملية بحل مبدئي مؤقت» ثم تقوم راجعة ا معلمات قلي 
معرفة ما إذا كان هكن تحسينٌ الحل وإعادة هذه المراجعة التكرارية حتى لا يمكن تحقيق أي 
تحسّن أو الوصول للحد الأدنى للغاية. وعند هذه النقطة يُقال: إِنَّ العملية قد اكتملت/ تقاربت. 

كانت التحليلاتٌ الرياضية تحظى بشعبية هائلة. وأصبح استخدامٌ تقنيات التحليلات المبنية 
على البيانات اتجاهًا سائدًا ليس فقط للفرّق الاحترافية؛ بل أيضَا للرياضات الجامعية والهواة. 
والتحليلات الرياضية تعني استخدام البيانات والتقنيات الإحصائية/ التحليلية لإدارة الفرّق/ 
المنظمات الرياضية على نحو أفضل. ونَعَدٌ الحالة العملية ٤-۲‏ مثالًا على كيفية استخدام مصادر 
البيانات العامة الموجودة والمتاحة بسهولة للتنبؤ بنتائج مباراة في كرة القدم الجامعية باستخدام 
كل من نماذج التصنيف ونماذج التنبق بنوع الانحدار. 
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الفصل الثاني 


حالة عملية ٤-۲‏ 
توقع نتائج لعبة وعاء 721044 

يُعَدُ التنبؤ بنتيجة لعبة كرة القدم الجامعية (أو أيّ لعبة رياضية أخرى) مشكلةٌ 
مشيرةً للاهتمام ومليئةٌ بالتحدّيات. ولذلك؛ فقد بذل هواة التحَدَّي من الباحثين 
سواءً الأكاديميين أو الصناعيين جهدًا عظيمًا في التنبوٍ بنتائج الأحداث الرياضية. 
تُوجّد كمياتٌ كبيرةٌ من البيانات التاريخية في منافذ إعلامية مختلفة (غالبًا ما تكون 
معلنةٌ) فيما يتعلّق بهيكل ونتائج الأحداث الرياضية في شكلٍ مجموعة متنوعة من 
العوامل التي يتم تمثيلها عدديًا أو رمزيًا والتي يفترض أنها تُسهم في تلك النتائج. 
يعد وعاء ألعاب نهاية الموسم في غاية الأهمية بالنسبة للكليات من الناحية 
المالية (لتحقيق عائد إضافي يصل لملايين الدولارات) بالإضافة إلى السُمعة؛ وذلك 
بغرض ضمٌ الطلاب المتفوقين والرياضيين أصحاب التقديرات الكبيرة على برامجهم 
الرياضية في أثناء مرحلة الدراسة p95 (Freeman & Brewer, 2016) pÈ‏ 
الفرق التي يتم اختيارها للتنافس في وعاء لعبة معينة باقتسام الجائزة المالية, 
بمقدارٍ يعتمد على ذلك الوعاء لكل منهم (بعض الأوعية تكون أكثر فخامةٌ وذات 
دفعات أعلى للفريقين)؛ ولذلك يُعَدٌ ضمان دعوة إلى وعاء اللعبة؛ هو الهدف 
الرئيسي لأيّ برنامج كرة قدم لقسم 1-4 بالكلية. ويتمٌ مَنْحِ متخذي القرارات 
لألعاب الوعاء صلاحية اختيار ودعوة الجمهور المستحق (فريق لديه ستة 
انتصارات ضد خصومه في القسم 1-4 في ذلك الموسم) للفرّق الناجحة (حسب 
التقديرات والتصنيفات العالمية) التي ستلعب المباراة بشكل مثير وتنافسي؛ مع 
الحفاظ على ما تبقى من المشجعين المنضبطين عبر منافذ الإعلام ا متنوعة. وفي 
دراسة حديثة حول التنقيب في البيانات؛ استخدم كل Cogdells Delen jo‏ 
lé Kasaps‏ سنوات من بيانات لعبة (JI bowl‏ جانب ثلاث تقنيات شائعة 
للتنقيب في البيانات (أشجار القرارء والشبكات العصبية» وآلة المتجهات الداعمة)؛ 
للتنبو بكلّ من نتائج تصنيف إحدى الألعاب (الفوز مقابل الخسارة)؛ فضلًا عن 
النتيجة من نوع الانحدار (فرق النقاط المسقطة بين درجات الخصمين). وفيما 
يلي وصفٌ مختصرٌ لدراستهم تلك. 
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المنهجية: 

في هذا البحث؛ اتبع دلين وزملاؤه منهجيةً واسعة الانتشار في التنقيب في 
البيانات تُسمّى CRISP-DM‏ (عملية قياسية عبر الصناعة لتعدين البيانات)» 
وهي عمليةٌ من ست خطوات. وقد وَقَرَت هذه المنهجية المشهورة» والتي Gea‏ 
تناولها بالتفصيل في الفصل الرابع» طريقة منهجية ومنظمة لإجراء دراسة التنقيب 
في البيانات الأساسيةء ومن ثم زادت من احتمالية الحصول على نتائج دقيقة 
وموثوقة. ولتقييم قوة التنبؤ لأنواع النماذج المختلفة بموضوعية؛ قاموا باستخدام 
منهجية للتحقق من الفاعلية» والتي تُسمّى س-أجزاء ses. .(K-folds)‏ الاطلاع 
على تفاصيل منهجية 1-1014 في الفصل الرابع. ويوضّح الشكل ١١-١‏ بيانيًا 
المنهجية المُستَخدّمة من قبل الباحثين. 
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شكل 17-7: الرسم التوضيحي للمنهجية المستخدمة في الدراسة 

اقتناء ومعالجة البيانات: 
تم جمعٌ بيانات العينة لهذه الدراسة من مجموعة متنوعة من قواعد 
البيانات الرياضية المتاحة على ESPN.coms jhowel.net JS à Le «53)l‏ 
.rauzulusstreet.coms ncaa.orgs Covers.coms‏ تضمَّنتَ مجموعة البيانات 
hla YEE‏ تمثل مجموعةً كاملةً من ثمانية مواسم من مباريات كرة القدم الجامعية 
التي تمّ لعبها بين عامي ۲۰۰۲ و۹١٠۲م.‏ وقد قمنا أيضًا بتضمين مجموعة بيانات 
خارج العينة (ألعاب ١٠١۲-٠٠١۲م)؛‏ للحصول على أغراض فاعلية إضافية. وقد 
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تمّ استخدامٌ بديهية واحدة من البديهيات الرائجة في التنقيب في البيانات» وقاموا 
بتضمين الكثير من المعلومات ذات الصّلة في النموذج قدر الإمكان. لذلك؛ فبعد 
عملية متعمقة لتحديد وتجميع المتغيرء انتهى بهم الأمرٌ إلى مجموعة بيانات 
شملت doa Y‏ كانت أول 1 متغيرات منها تتعلّق بتحديد الهوية (أيْ: اسم 
وتاريخ المباراة وأسماء الفرقء صاحب الأرض والضيفء ومؤتمراتهم الرياضية - 
انظر: المتغيرات من ١‏ إلى ٦‏ في الجدول »)0-١‏ ثم يتبعهم 78 متغيرا للمدخلات 
(تضمّنَت متغيرات لتحديد الإحصاءات الموسمية للفريق بشأن الهجوم والدفاع. 
ونتائج المباريات» وخصائص تكوين الفريق» وخصائص المؤتمرات uel JI‏ وكيف 
نجحوا في تحَطّي الصعاب - انظر: المتغيرات من إلى 6" في الجدول 0-97), وأخيرا؛ 
كان آخرٌ اثنين من المتغيرات WinLosss ScoreDiff las) cole xU‏ - حيث 
يعني 5606111 فرق النقاط بين الفريق صاحب الأرض والفريق الضيف ممثلةٌ 
بعدد صحيح, في حين يشير 18181:055 إلى فوز أو خسارة الفريق صاحب الأرض 
للعبة الوعاء والممثلة بعلامة اسمية). 

في صياغة مجموعة البيانات؛ قام كل صف Aull lodh a.k.a. tuple)‏ 
المثال... إلخ) بتمثيل لعبة وعاء, واختص كل عمودٍ متغير (أيْ: نوع المتغير معرف/ 
مدخلات أو مخرجات). ولتمثيل الخصائص النسبية المرتبطة باللعبة للفريقين 
المتنافسينء في متغيرات المدخلات؟ قمنا بحساب واستخدام الفروق بين مقاييس 
الفريق صاحب الأرض والفريق الضيف. ويتمُ حسابٌ كلّ قيم المتغير هذه من 
منظور الفريق صاحب الأرض. على سبيل اللثال: يمثل المتغير 226 (متوسط عدد 
النقاط التي سجلها الفريق في كل مباراة) الفرق بين ال 886 للفريق صاحب 
الأرض وال 256 للفريق الضيف. وتمئّل متغيرات المخرجات فوز أو خسارة 
الفريق صاحب الأرض للمباراة. بمعنىء لو يأخذ متغير 50162115 رقمًا صحيحًا 
موجبّا؛ فمن المتوقع أن يفوز الفريق صاحب الأرض باللعبة بهذا الهامشء وإلا 
(أيْ: لو يأخذ المتغير 560162115 رقمًا صحيحًا سالبًا) فعندئذ نتوقع أن يخسر 
الفريق صاحب الأرض اللعبة بهذا الهامش. في حالة 58151.055: تكون قيمة متغير 
المخرجات عبارة عن تسمية ثنائية ”هذ“ أو ”1.055“ وهي تشير إلى نتيجة 
المباراة بالنسبة للفريق صاحب الأرض. 
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النتائج والتقييم: 

في هذه الدراسة؛ يتخ lai ul‏ ثلاث تقنيات تنبق رائجة لبناء النماذج 
(ومقارنتها بعضها مع بعض): الشبكات العصبية الاصطناعيةء وأشجار القران 
وآلة المتجهات الداعمة. ويتمٌ اختيار تقنيات التنبؤ هذه وفقاً لقدرتها على نمذجة 
كل من التصنيفات إضافةً إلى مشكلات التنبق من النوع الانحداري وانتشارها 
في أدبيات التنقيب في البيانات المنشورة حديئًا. ويمكن العثور على مزيد من 
التفاصيل حول طرق التنقيب في البيانات الشائعة هذه في الفصل الرابع. 

لمقارنة الدقة التنبؤية لجميع النماذج بعضها ببعض؛ استخدم الباحثون 
منهجية التحقق المتقاطع الطبقي 1014->1. في النسخة الطبقية من 1014ل 
يتم إنشاء الطبقات بطريقة تحتوي على نفس النسبة تقريبًا من علامات التنبؤ 
ssl)‏ الطبقات) كما في مجموعة البيانات الأصلية. وفي هذه الدراسة؛ يتم وَضْعَ 
قيمة 10 = K‏ (أيْ: يتم تقسيم المجموعة الكاملة المكوّنة من 64" عينة إلى ٠١‏ 
مجموعات فرعية» بكلّ منها 10 عينة تقريبًا» والذي يُعَدُ ممارسةً شائعةً في 
تطبيقات التنقيب عن البيانات التنبؤية. وقد سبق توضيح 1-1014 برسم بياني 
قبل ذلك في هذا الفصل. ولمقارنة نماذج التنبؤ التي تمّ تطويرها باستخدام تقنيات 
التنقيب الثلاث المذكورة آنقَا؛ فقد استقرٌ الباحثون على استخدام ثلاثة معايير أداء 
شائعة الاستخدام» هي: الدقةء والحساسية» والخصوصية. كما تمّ شرح المعادلات 
البسيطة لهذه المقاييس في وقتٍ سابق في هذا الفصل. 


جدول 0-7: وصف للمتغيرات المستخدمة في الدراسة 



































م |الفئة إسم المتغير الوصف 

YEAR | ID| 1‏ سنة لعبة الوعاء 

BOWLGAME| ID| 2‏ اسم لعبة الوعاء 

HOMETEAM | ID| 3‏ القريق صاحب الأرض (كما هو مُدرَّج من قبل منظمي الوعاء) 
AWAYTEAM | ID| 4‏ الفريق LS Go gI ga LS) iil‏ منظمي الوعاء) 
HOMECONFERENCE | ID| 5‏ | مؤتمر الفريق صاحب الأرض 
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Xl e‏ إسم المتغير الوصف 
AWAYCONFERENCE | ID| 6‏ | مؤتمر الفريق الضيف 

DEFPTPGM | I1| 7‏ نقاط دفاعية لكل مباراة 

DEFRYDPGM| I1| 8‏ ساحات الاندفاع الدفاعية لكل مباراة 

DEFYDPGM | 11| 9‏ ساحات دفاعية JI‏ مباراة 

PPG| I1|10‏ متوسط عدد النقاط التي سجلها فريقٌ معين في كل مباراة 
PYDPGM | I1|11‏ متوسط عدد التمريرات الميدانية الإجمالي لكلّ مباراة 

RYDPGM | I1 |12‏ متوسط إجمالي عدد مرات الفوز في كل فريق لكل مباراة 
YRDPGM| I1|13‏ متوسط عدد الهجمات الميدانية لكل مباراة 

XHMWIN | 1214‏ نسبة الفوز الرئيسية 

LAST7| 12|15‏ كم عدد المباريات التي فاز بها الفريق من آخر ا مباريات 
MARGOVIC| 12|16‏ متوسط هامش الفوز 

Nonconference (3:3 55$ نسبة‎ NCTW| 12|17 

PREVAPP| 12/18‏ هل ظهر الفريق في مباراة في العام الماضي 

XRDWIN| 12/19‏ نسبة الفوز على الطريق 

SEASTW | 12|20‏ نسبة الفوز للسنة 

TOP25| 12|21‏ الفوز نسبة ضد أعلى 0؟ فريق 47 للسنة 

TSOS| 13]22‏ قوة الجدول الزمني للسنة 

XFR| 13|23‏ نسبة المباريات التي يلعبها لاعبو الصف الأول في السنة 
XSO| I3]24‏ نسبة المباريات التي يلعبها لاعبو الصف الثاني في السنة 
XIR| I3]25‏ نسبة المباريات التي يلعبها اللاعبون الأحدث سنا لهذا العام 
XSR| 13|26‏ النسبة المئوية للألعاب التي لعبها لاعبون من الدرجة الأولى خلال العام 
XSEASOvUn| 14|27‏ نسبة المرات التي مَرٌ فيها الفريق على 0/17* في الموسم الحالي 
XATSCOV | 14|28‏ مقابل نسبة تغطية انتشار الفريق في المباريات السابقة 
XUNDER| 14/39‏ النسبة المئوية طرات انهيار الفريق في المباريات السابقة 
XOVER| 14/30‏ نسبة المرات التي اجتازها الفريق في مباريات سابقة 
XSEASATS| 14|31‏ نسبة التغطية مقابل الانتشار للموسم الحالي 
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م |الفئة إسم المتغير الوصف 

CONCH| 15|32‏ هل فاز الفريق ببطولة المؤتمر الخاصة بهم؟ 

CONFSOS| 15 |33‏ قوة المؤتمر من الجدول الزمني 

XCONFWIN | I5|34‏ نسبة الفوز في ا مؤتمر 

ScoreDiffo | O1 | 35‏ فرق النقاط (نقاط صاحب الأرض - نقاط الضيف) 

WinLosso | O2 36‏ ما إذا كان الفريق صاحب الأرض يفوز أو يخسر اللعبة 





* 0/1 - ما إذا كان الفريق سيخترق أو يقل عن فرق النقاط المتوقعة. 
© متغيرات الإخراج: 0۲۵1۴ء5 لنماذج الانحدار وsوه‏ ]ه۷1 لنماذج التصنيف الثنائية. 
1 ال مخالفة/ الدفاع؛ 12: نتيجة اللعبة؛ 13: تكوين الفريق: 14: ضد الصعاب؛ 15: إحصائيات ال مؤتمر. 
2 متغيرات تحديد الهوية؛ 01: متغير المخرجات لنماذج الانحدار؛ 02: متغير المخرجات لنماذج التصنيف. 
ويتمٌ تقديمٌ نتائج التنبؤ لتقنيات النمذجة الثلاث في الجدول 7-١‏ والجدول 
۷-۲ إذ يعرض الجدول 1-۲ نتائج الفاعلية المتقاطعة من ٠١‏ أضعاف منهجية 
التصنيف؛ إذ تنم صياغة تقنيات التنقيب في البيانات الثلاثة؛ بحيث يكون لها 
متغير مُخرجات ثنائي التسمية (أيْ: 1801.099). في حين V-Y Joaedl eA A5‏ 
نتائج الفاعلية المتقاطعة من ٠١‏ أضعاف بنهجية التصنيف المستندة إلى الانحدار؛ 
إذ نُصاغ تقنيات التنقيب في البيانات الثلاثة؛ بحيث يكون لها متغير مخرجات 
رقمي (أَيْ: 0:61 5). في التنبؤ بالتصنيف القائم على الانحدار؛ يتم تحويلٌ 
المخرجات العددية للنماذج إلى تصنيفات عن طريق وضع علامة “W:«”‏ على أرقام 
55 الموجبة وعلامة ”055.]“ على أرقام 187181055 السالبة ثم جدولة ذلك 
كله في مصفوفات الارتباك. باستخدام مصفوفات الارتباك؛ يتم حساب دقة التنبؤ 
الشاملةء والحساسيةء والنوعية US)‏ نوع من أنواع النماذج وعرضها في هذين 
الجدولين. وكما تشير النتائج؛ فإن أساليب التنبؤ من نوع التصنيف تؤدي بصورة 
أفضل من منهجية التنبؤ من نوع التصنيف القائم على الانحدار. ومن بين تقنيات 
التنقيب في البيانات الثلاثة؛ أنتجت أشجارٌ التصنيف والانحدار Jal fgs fa‏ 
في کل من منهجيتي التنبق المشار إليهما. وبشكل عام؛ أنتجت نماذج التصنيف 
ونماذج شجرة الانحدار ممنهجية الفعالية المتقاطعة ٠١‏ أضعاف نسبة دقة تصل إلى 
۸ تليها آلة المتجهات الداعمة بنسبة دقة تصل إلى ١5,0/ا/‏ ثم الشبكات 
العصبية بنسبة دقة تصل إلى 0/. وباس تخدام اختبار :» وجد الباحثون أَنَّ قيم 
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الدقة هذه كانت مختلفةًٌ بشكل معنوي عند مستوى ألفا ٠0‏ أي إِنَّ شجرة 
القرارات تُكَد مسرا أفضل بش كل معنوي لهذا النطاق من الشبكة العصبية وآلة 
نقل الدعم, وأيضًا آلة نقل الدعم تُعَد مؤشرًا أفضل بكثير من الشبكات العصبية. 


جدول 5-7: نتائج التنبؤ لمنهجية التصنيف المباشر 
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* متغير المخرجات: هو متغير فئوني ثنائي (10/10 أو 055.آ)؛ كانت الفروق معنوية. 
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جدول :V-Y‏ نتائج التنبؤ لمنهجية التصنيف القائم على الانحدار 
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* متغير المخرجات هو متغير رقمي/ عدد صحيح (فرق النقط)؛ كانت الفروق معنوية. 
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وقد أظهرت نتائجٌ الدراسة أنَّ نماذج التصنيف النوعية تتنب أ بنتائج اللعبة 
بشكل أفضل من نماذج التصنيف القائمة على الانحدار. وعلى الرغم من أنَّ هذه 
النتائج خاصة بالنطاق العملي والبيانات المس تخدّمة في هذه الدراسة. وبالتالي 
لا ينبغي تعميمها خارج نطاق الدراسة؛ فهي مثيرة؛ وذلك لأن أشجار القرار 
ليست الأفضل في التنبؤ فحسب ولكن أيضًَا هي الأفضل في الفهم والنشرء مقارنةٌ 
مع التقنيتين الأخرتين لتعلّم الآلة المستخدمتين في هذه الدراسة. ويمكن العثور 
على مزيد من التفاصيل حول هذه الدراسة (YAY 55,15 Delen) à‏ 
أسئلة للمناقشة: 


-١‏ ما هي التحديات المتوقعة في التنبقٍ بنتائج الأحداث الرياضية (على سبيل 
المثال: ألعاب مباراة الكلية)؟ 

؟- كيف قام الباحثون بصياغة/ تصميم مشكلة التنبؤ (أيْ: ما هي المدخلات 
وا مخرجات؟ وماذا كان تمثيل عينة واحدة - صف بيانات؟) 

۴- ما مدى نجاح نتائج التنبق؟ وما الذي يمكنهم فعله لتحسين الدقة؟ 

Sources: Delen, D., Cogdell, D., & Kasap, N. (2012). A compara- tive analysis of 


data mining methods in predicting NCAA bowl outcomes. International Journal of 


Forecasting, 28, 543-552; Freeman, K. M., & Brewer, R. M. (2016). The politics of 


American college football. Journal of Applied Business and Economics, 18(2), 97-101. 


التنبق بالسلاسل الزمنية: 

في بعض الأحيان قد لا يكون للمتغير الذي نحن بصدد دراسته (أيْ: متغير الاستجابة) متغيرات 
تفسيرية واضحة المعالم, أو قد يكون هناك الكثيرُ منها في علاقة مُعقدة للغاية. في مثل هذه 
الحالات؛ إذا كانت البيانات متاحةً في الشكل المطلوبء فيمكن تطوير نموذج التنبؤء والذي يُسمّى 
السلسلة الزمنية. تُعّف السلسلة الزمنية على أنها سلسلةٌ من نقاط البيانات للمتغيّر محل 
الاهتمام» ويتم قياسها وتمثيلها في نقاط متتالية في الوقت متباعدة في فواصل زمنية مُوحّدة. ومن 
أمثلة السلاسل الزمنية أحجام الأمطار الشهرية في منطقة جغرافية ماء وقيمة الإغلاق اليومي 
لمؤشرات سوق الأوراق الماليةء ومجموع المبيعات اليومية لمحل بقالة. وفي كثيرٍ من الأحيان؛ يتم 
تصوير السلسلة الزمنية باستخدام منحنى خطي. ويُوضّح الشكل 17-١‏ مثالا لسلسلة زمنية 
لحجم المبيعات للسنوات من ٠٠١8‏ حتی ۲۰۱۲ على أساس ربع سنوي. 
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يُعرف التنبؤ بالسلسلة الزمنية على أنه استخدامٌ النمذجة الرياضية للتنبؤ بالقيم المستقبلية 
للمتغير محل الاهتمام بناءً على القيم التي تمّ رصدها من قبل. تبدو مخططات/ جداول السلاسل 
الزمنية مشابهةٌ جداً للانحدار الخطي البسيط في ذلك كما كان الحال في الانحدار الخطي البسيطء 
في السلسلة الزمنية يُوجَّد متغيران: متغير الاستجابةء ومتغير الوقت المعروض في مخطط مبعثر. 
وبخلاف هذا التشابه؛ لا يكاد يكون هناك أي قواسم مشتركة أخرى بين الاثنين. وعلى الرغم من 
أنَّ تحليل الانحدار يتم توظيفه في اختبار النظريات؛ للعرفة ما إذا كانت القيمٌ الحالية لواحد أو 
أكثر من المتغيرات التفسيرية تفسر (وبالتالي تتنبأ ب) متغير الاستجابة؛ فإن نماذج السلاسل الزمنية 
تركز على الاستقراء على سلوكها المتغير مع الوقت لتقدير القيم المستقبلية. ويفترض التنبؤ 
بالسلاسل الزمنية أن جميع المتغيرات التفسيرية يتم تجميعها واستهلاكها في دراسة سلوك اختلاف 
الوقت لمتغير الاستجابة. ولذلك؛ فإن اكتشاف سلوك تغيّر الوقت؛ هو طريقة للتنبؤ بالقيم 
المستقبلية لمتغير الاستجابة. وللقيام بذلك؛ يتم اختصارٌ النمط وتحليله إلى مكوناته الرئيسية: 
الاختلافات العشوائية» والاتجاهات الزمنية» والدورات الموسمية. ويوضّح مثال السلاسل الزمنية 
المعروض في الشكل YV-Y‏ كلّ هذه الأنماط المميزة. 
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شكل :١1/-7‏ سلسلة زمنية للبيانات عن أحجام المبيعات ربع السنوية 
وتتراوح التقنيات الس تَخدّمة في تطوير تنبؤات التسلسل الزمني من بسيطة جدًا (مثل التنبؤ 
البسيط الذي يقترح أن يكون الفعلي بالأمس هو المتوقع اليوم) إلى معقد جدًا مثل ARIMA‏ 
(وهي طريقةٌ تجمع بين أنماط المتوسطات المنحدرة والمتحركة في البيانات). ورها تكون التقنيات 
الأكثر شيوعًا؛ هي طرق إيجاد المعدل, والتي تتضمّن المتوسط البسيط والمتوسط المتحرك» والمتوسط 
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المتحرك المرجح. والتضخيم الأسي. كما أنَّ العديد من هذه التقنيات لها إصداراتٌ متقدمةٌ بحيث 
يمكنها أيصًا أن تأخذ في حُسبانها كلا من الموسمية والاتجاه للتنبق بشكل أفضل وأكثر دقة. وعادةً ما 
يتم تقييم دقة الطريقة من خلال حساب خطأها (أَيْ: الانحراف المحسوب بين الفعليات والتنبؤات 
الخاصة بالملاحظات السابقة) عن طريق الوسط الحسابي للخطأ المطلق (:8681)» أو الوسط الحسابي 
للخطأ التربيعي (:8151) أو الوسط الحسابي للخطأ المطلق في النسبة المئوية (۸۲۴). وعلى الرغم 
من أن جميعهم يستخدمون نفس مقياس الخطأ الأمامي؛ فإنَّ طرق التقييم الثلاث هذه تؤكد 
الجوانب المختلفة للخطأ؛ إذ تقوم بتركيب بعض الأخطاء الكبيرة أكثر من الأخطاء الأخرى. 


أسئلة مراجعة على القسم :5-٠‏ 

-١‏ ما هو الانحدار؟ وما هو الغرض الإحصائي الذي يخدمه؟ 

la -Y‏ هي أوجه الشبه والاختلاف بين الانحدار والارتباط؟ 

- ما هو 01:5؟ وكيف يحدد 018 خط الانحدار الخطي؟ 

4- اذكر مع الشرح الخطوات الرئيسة لمتابعة تطوير نموذج الانحدار الخطي. 

۵- ما هي أكثر الافتراضات شيوعًا للانحدار الخطي؟ 

la -T‏ هو الانحدار اللوجستي؟ وكيف يختلف عن الانحدار الخطي؟ 

۷- ما هي السلاسل الزمنية؟ وما هي تقنيات التنبؤ الرئيسة لبيانات السلاسل الزمنية؟ 


V-Y‏ إعداد تقارير الأعمال: 

يحتاج صانعو القرار إلى معلومات لاتخاذ قرارات دقيقة في الوقت المناسب؟ إذ تُعَذُ المعلومات 
في الأساس سيق البيانات. إضافةً إلى الوسائل الإحصائية التي تمّ شرحها في القسم السابق» 
وهكن de Jya Lá‏ ا معلومات (التحليلات الوصفية) باستخدام أنظمة معالجة التحليلات 
عبر الإنترنت [01:12] (انظر: التصنيف البسيط للتحليل الوصفي في الشكل 7-7). عادةً ما يتم 
تقديم المعلومات إلى صُناع القرار في شكل تقريرٍ مكتوب (رقميا أو ورقيًا) مع وجود إمكانية 
لتقديمه شفويًا أيضًا. وببساطة؛ فإن أيّ تقرير هو عبارة عن أيّ وسيلة اتصال تمَّ إعدادها؛ بغرض 
نقل المعلومات في شكل مقبول إلى كلّ مَنْ يحتاج إليهاء في أيّ وقت وفي أيّ مكان قد يحتاج إليها 
فيه. وعادةٌ ما يكون التقريرٌ عبارة عن مستندٍ يحتوي على معلومات (عادةً ما تكون مبنيةٌ على 
البيانات) منظمةً في شكل سرد و/ أو بياني و/ أو مجدول؛ يتم إعدادها بشكلٍ دوري (متناوب) أو 
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على أساس الحاجة (حسب الغرض». بالإشارة إلى فترات زمنية مُحدَّدةء أو أحداث أو حوادث أو 
موضوعات. وبإمكان تقارير الأعمال القيام بالعديد من الوظائف المختلفة (ولكنها غالبًا ما تكون 
ذات صلة بعضها ببعض). وفي ما يلي أمثلةٌ على أكثر هذه التقارير انتشارًا: 
- تقارير التأكّد من قيام جميع الإدارات بوظائفها بشكلٍ صحيح. 
- تقارير لتوفير المعلومات. 
- تقارير لتوفير نتائج التحليل. 
- تقارير لحَثّ الآخرين على الأداء. 
- تقارير إنشاء ذاكرة تنظيمية (كجزء من نظام إدارة ا معرفة). 

يُعَذّ إعداد تقارير الأعمال (والذي يُسمّى أيضًا 01.47 أو ذكاء الأعمال) Shol ga Gulal lz‏ 
القيادة العليا بشأن اتخاذ القرارات الإدارية المثالية المحسّنة والقائمة على الأدلة. وينظر إلى أساس 
هذه التقارير التجارية على أنها مصادرٌ مختلفة للبيانات القادمة من داخل أو خارج المؤسسة 
(أنظمة معالجة العمليات التجارية عبر الإنترنت [01:18]). ويتضمّن إنشاءٌ هذه التقارير إجراءات 
1 (الاستخراج» والتحويل» والتنزيل) بالتنسيق مع مستودع البيانات» ثم استخدام واحد أو أكثر 
من أدوات إعداد التقارير (انظر الفصل ٣‏ للحصول على وصف مُفْصّل لهذه المفاهيم). 

وبسبب التوشّع السريع في تقنية المعلومات بجانب الحاجة إلى تحسين القدرة التنافسية في 
قطاع الأعمال؛ فقد حدثت زيادةٌ في استخدام القدرة الحاسوبية لإنتاج تقارير مُوحّدة تنضمُ إلى 
وجهات نظر مختلفة للمشروع في مكانٍ واحد. وعادةٌ ما تتضمّن عملية إعداد التقارير هذه 
الاستعلام عن مصادر البيانات المهيكلة والتي تمَّ إنشاء معظمها باستخدام نماذج بيانات منطقية 
وقواميس بيانات مختلفة؛ وذلك لإنتاج تقرير يسهل قراءته واستيعابه. كما تسمح هذه الأنواع 
من تقارير الأعمال للمديرين وزملاء العمل بالبقاء على دراية ومشاركة والقدرة على النظر في 
الخيارات والبدائل لاتخاذ قرارات صائبة. ويوضح الشكل 18-7 دورةً مستمرةٌ من الحصول 
على البيانات > توليد المعلومات > صنع القرار > إدارة عمليات الأعمال. ولعل المهمة الأكثر 
حساسيةً في هذه العملية الدورية؛ هي إعداد التقارير (أيْ: توليد المعلومات) - وتحويل البيانات 
من مصادر مختلفة إلى معلومات قابلة للتطبيق. 

إِنَّ مفاتيح النجاح لأيّ تقرير هي الوضوح والإيجاز والاكتمال والصواب. وتتغير طبيعة التقرير 
ومستوى أهمية هذه العوامل المؤدية إلى النجاح بشكلٍ كبير بناءً على «ممن يتم توجيه هذه 
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التقارير؟». يتم توجيه معظم البحوث في التقارير الفعّالة نحو التقارير الداخلية التي تمد أصحاب 
المصلحة وصانعي القرار داخل امنظمة با معلومات. وهناك أيضًا تقارير خارجية بين الشركات 
والحكومة (مثل: تقارير لأغراض الضريبة أو للإيداعات المنتظمة إلى لجنة الأوراق المالية والبورصات). 







































































(إعداد تقارير) 


شكل ؟-18: دور إعداد تقارير المعلومات في اتخاذ القرارات الإدارية 


وعلى الرغم من وجود تشكيلة عريضة من التقارير التجارية؛ فإنه هكن تصنيف تلك التي يتم 
استخدامها غالبًا لأغراض إدارية إلى ثلاث فئات رئيسة (2016 ,اان8). 





à 


- تقارير إدارية موزونة: في العديد من المؤسسات؛ تتم إدارة أداء الأعمال من خلال مقاييس 
مُوجَّهة باتجاه النتائج. بالنسبة للمجموعات الخارجية؛ تكون هذه الاتفاقيات على مستوى 
الخدمة. أمّا بالنسبة للإدارة الداخلية؛ فتُعَدُ مؤشرات الأداء الرئيسة oleg (KPIs)‏ ما يكون 
هناك أهدافٌ متفق عليها على نطاق المؤسسة؛ ليتم تعقّبها على مدى فترة زمنية ما. وهكن 
استخدامها كجزء من إستراتيجيات الإدارة الأخرى مثل 518008 عذ5 أو إدارة الجودة الشاملة. 

- تقارير من نوع لوحة المعلومات: كانت الفكرةٌ الشائعة في التقارير التجارية في السنوات الأخيرة, 
هي تقديم مجموعة من مؤشرات الأداء المختلفة على صفحة واحدة. مثل لوحة القيادة في 
السيارة. وعادةً ما يوفر منتجو لوحة المعلومات مجموعةً من التقارير المُحَدِّدة مسبقاً بعناصر 
ساكنة وهيكل Cob‏ مع السماح أيضًا بتخصيص احتياجات لوحة المعلومات وطرق العرض 
ووضع أهداف بلقاييس مختلفة. ومن الشائع أن تكون هناك إشارات ضوئية مرورية ملونة 
كإشارات المرور المحدّدة للأداء (الأحمرء الأصفر, الأخضر)؛ وذلك لتوجيه انتباه الإدارة إلى مناطق 
معينة. وسيتمٌ الخوض بتفاصيل أكثر عن لوحات المعلومات في جزءٍ لاحق من هذا الفصل. 
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- تقارير متوازنة من نوع بطاقات الأداء: قام بتطوير هذه الطريقة «Kaplan and Norton‏ 
وهي طريقةٌ تحاول تقديم رؤية متكاملة للنجاح في أي مؤسسة. وإضافةً إلى الأداء المالي؛ S‏ 
التقارير المتوازتة من نوع بطاقات الأداء تتضمّن أيضًا العملاء وعملية الأعمال ووجهات نظر 
peil‏ والنمو. وسنعرض مزيدٍ من التفصيل بطاقات الأداء المتوازنة لاحقًا في هذا الفصل. 

تقدّم الحالة العملية ؟-0 مثالا لتوضيح قوة وفائدة إنشاء التقارير الآلية (وفي وقت من 

الأزمات الطبيعية والفوضوية إلى حَنَّ ما) لمنظمة كبيرة. مثل: FEMA‏ 


حالة عملية ٥-۲‏ 
انتهاء فیضان FEMA $ ög!‏ 

حصل الموظفون في وكالة إدارة الطوارئ الفيدرالية (858314) - وهي وكالةٌ فدرالية 
أمريكية تنسّق الاستجابة للكوارث عندما يعلن الرئيسُ عن وقوع كارثة وطنية - على 
فيضانين في آنٍ واحد. أولًا: غطْت المياه الأرض. بعد ذلك؛ غطَّى Sas‏ كبيدٌ من الأوراق 
المطلوبة من جانب إدارة البرنامج الوطني للتأمين ضد الفيضانات )N۴1۶(‏ مكاتب 
هؤلاء الموظفين؛ إذ تع CS‏ حزم كثيرة من التقارير المخططة باللون الأخضر من 
الطابعة المركزية في تلك المكاتب. كانت التقارير الفردية في بعض الأحيان ذات سُمْك 
يبلغ ۱۸ بوصة» مع مجموعة صلبة من المعلومات حول مطالبات التأمين أو أقساط 
التأمينء أو مدفوعات مدفونة فيها في مكانٍ ما. 

لا يدعي بيل بارتون ومايك مايلز أنهما قادران على فعل أي شيء حيال الطقس؛ 
ولكن قام مديرٌ المشروع وعامٌ الحاسب, على التواليه من مؤسسة علوم الحاسب (CSC)‏ 
باستخدام برنامج 1876618060175 من ”بناة المعلومات"» لإعادة تدفق فيضان الورق 
بواسطة «7411. يسممح البرنامجٌ للحكومة بالعمل مع شركات التأمين الوطنية؛ لجمع 
أقساط التأمين ضد الفيضانات ودفع المطالبات للفيضانات في المجتمعات التي تبني 
تدابير معينة للتحكم في الفيضانات. وكنتيجة لعمل لجنة ©05؛ لم يَعْد موظفو FEMA‏ 
بحاجة إلى تصفح تقارير ورقية للعثور على البيانات التي يحتاجون إليها. وبدلًا من 
ذلك؛ يتصفحون بيانات التأمين 24 «NFIP's BureauNet g35a (4 e 85s‏ ويختارون 
فقط ال معلومات التي يرغبون في رؤيتهاء ويحصلون منها على تقريرٍ معروض على شاشة 
أو يقومون بتنزيل البيانات في صورة جدول. وهذه مجرد بداية للمدخرات التي قدَّمها 
5.75 وقد انخفض عددٌُ المرات التي يطلب فيها موظفو 111718 من 050 
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لتقارير خاصة إلى النصف؛ لأن موظفي 715818 صار بإمكانهم إنشاءٌ العديد من التقارير 
الخاصة التي يحتاجون إليها دون استدعاء مبرمج لتطويرها. إضافةٌ إلى تكلفة إنشاء 
]16116 في المقام الأول. ويُقدَّر بارتون أن استخدام برمجيات الويب وقاعدة 
البيانات التقليدية لتصدير البيانات من الإطار المركزي ل ۴۴14 وتخزينها في قاعدة 
بيانات جديدة. وربطها بخادم ويب - قد يُكلّف قرابة ال ٠٠١‏ ضعف - أي أكثر من 
٠‏ دولار - ويحتاج إلى حوالي عامين لإكماله. مقارنةً بالأش هر القليلة التي قضاها 
مایلز للوصول إلى الحل عن طریق -WebFOCUS‏ 

عندما هبّت عاصفة أليسون الاستوائية. وهي عبارة عن مجموعة سحابية 
ضخمة من الغيوم الدؤارة. وتحرّكت من خليج المكسيك على ساحل تكساس 
ولويزيانا في يونيو ٠٠٠1‏ قتلت ١6‏ شخصًا معظمهم من الغرقء كما دمّرت 
وحطّمَت ٠٠٠٠١‏ منزل وشركة. كما شرّدت أكثر من ٠٠٠٠١‏ عائلة. وأعلن الرئيس 
جورج دبلیو بوش مقاطعة تکساس ۲۸ كمنطقة كوارث, وتحرّكت FEMA‏ 
للمساعدة. كان هذا أول اختبار BureauNet sL‏ وتم تسليمه بالفعل. 
SESS‏ هذا الاستخدام الشامل الأول JJ] BureauNet .J‏ وصول موظفي FEMA‏ 
الميدانيين بسهولة إلى ما يحتاجون إليه عند الحاجة إليه. وطلب العديد من أنواع 
التقارير الجديدة. ولحُسْن الحظء كان مايلز و175 186615060 على مستوى المهمة. 
يقول بارتون: «في بعض الحالات سوف تطلب 78248 نوعًا جديدًا من التقارير يومًا 
ماء وسيحصل عليه مايلز على 80٠41۸٤٤‏ في الي وم التالي؛ وذلك بفضل السرعة التي 
يمكنه بها إنشاء تقارير جديدة في 507601001[5». 

وأشار بارتون إلى أن الطلب المفاجئ على النظام لم يكن له تأثيرٌ كبيٌ على أدائه. 
ويضيف: «لقد تعاملنا مع الطلب على ما يُرام؛ فلم تكن لدينا مشكلات في ذلك على 
الإطلاق. وقد أحدثنا فرقًا هائلًا ل ۴۴۸۷14 وللوظيفة التي كان عليهم القيامٌ بها. إذ م 
يكن لديهم هذا المستوى من الوصول من قبل. وأيضًا لم يكن بإمكانهم إنشاء مثل هذه 
التقارير ا مفصّلة والمحدّدة بمجرد النقر بالماوس على سطح مكتبهم كما هو الحال الآن». 

أسئلة للمناقشة: 





-١‏ ما هي ۴£14. وماذاتفعل؟ 


-١‏ ما هي التحديات الرئيسية التي تواجهها ۷4 $۴۴؟ 
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-١‏ كيف قامت ۴۴1۸ بتحسين ممارساتها غير IHI‏ لإعداد التقارير؟ 
Source: Information Builders success story. Useful information flows at‏ 
disaster response agency. informationbuilders.com/applications/fema‏ 


{accessed May 2016); and fema.gov. 

أسئلة مراجعة على القسم ۷-۲: 
-١‏ ما هو التقرير؟ وفيمَ تُستخدَم التقارير؟ 
؟- ما هو تقرير الأعمال؟ وما هي الخصائص الرئيسة لتقرير الأعمال الجيد؟ 
*- قم بوصف العملية الدورية للإدارة. مع التعليق على دور تقارير الأعمال. 
-٤‏ اذكر مع الشرح الفئات الثلاث الرئيسة لتقارير الأعمال. 
©- ما هي المكوّنات الرئيسة لنظام إعداد تقارير الأعمال؟ 
A-Y‏ تصوير البيانات: 

تمّ تعريف تصوير البيانات (أو بشكل أكثر ملاءمةً التصوير المعلوماتي) على أنه «استخدام 
التمثيلات المرئية لاستكشافء ووضع منطقء ونقل البيانات» (2007 ,160). وعلى الرغم من أن 
الاسم المُستَخِدَم بشكل شائع هو تمثيل البيانات؛ فإن المقصود من هذا هو تصوير المعلومات. 
ولأن المعلومات هي تجميع وتلخيص ووَضْع البيانات في سياقها (حقائق أولية)؛ فإن ما يتم 
تصويره هو ال معلومات وليس البيانات. ومع ذلك؛ ونظرًا لاستخدام ال مصطلحين تصوير البيانات 
وتصوير المعلومات بشكل متبادل ومرادف؛ فإننا سنتبع ذلك في هذا الفصل. 

يرتبط تصويرٌ البيانات ارتباطًا وثيقا بمجالات الرسومات البيانية للمعلومات» وتصوير 
المعلومات والتصوّر العلمي والرسومات البيانية الإحصائية. وحتى وقتٍ قريب؛ كانت الأشكال 
الرئيسة لتصوير البيانات المتاحة في كلّ من تطبيقات ذكاء الأعمال تتضمّن الجداول والرسوم 
البيانية؛ إضافةً إلى الأنواع الأخرى من العناصر المرئية ال مستخدّمة لإنشاء بطاقات الأداء ولوحات 
البيانات. ومن أجل فهم أفضل للاتجاهات الحالية والمستقبلية في مجال رؤية البيانات؛ فنرى هنا 
أنه من الأفضل البدء ببعض السياق التاريخي. 
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لمحة تاريخية عن تصوير البيانات: 

على الرغم من حقيقة أن تاريخ تصوير البيانات يعود إلى القرن الثاني الميلادي؛ فإِنّ معظم 
التط ورات التي حدثت في المئتين وخمسين عامًا الماضية؛ حدثت في الغالب خلال الثلاثين سنة 
(Few, 2007) Ja 38 à. 2MI‏ وعلى الرغم من أن التصوير المرثي م يُعترف به على نطاق واسع 
كنظام حتى وقت قريب؛ فإنَّ الأشكال المرئية الأكثر شيوعًا اليوم تعود إلى بضعة قرون سابقة. 
وقد شجّع الاستكشاف الجغرافيء والرياضياتء والتاريخ الشعبي على إنشاء خرائط مبكرة ورسوم 
بيانيةء وجداول زمنية تعود إلى القرن السابع عشر؛ غير أنَّ الفضل ينس ب إلى ويليام بلايفير على 
نطاق واسع كمخترع الرسم البياني الحديث؛ وذلك بعد أن أنشأ أول شريط رسومات بيانية مُوزّع 
على نطاق واسع في أطلسه التجاري والسياسي p WT pl‏ وهو ما يُعَد بشكلٍ dsl ele‏ سلسلة 
زمنية تصوّر الرسومات البيانية في كتابه الإحصائيء الذي نُشْرَّ في عام ١160م‏ (انظر: الشكل 19-9). 


























Ths Bottom òx ù dinit iste Yars. the Right horel ine. sity L1G000 ach 


te aea e DH a Mr tata 








شکل ۱۹-۲: خط بياني eM Y à WILLIAM PLAYFAIR (b os às) dLaLo JsV‏ 
ولعل أبرز مبتكر للرسومات البيانية للمعلومات خلال هذه الفترة؛ كان تشارلز جوزيف 
مينارد الذي صوّر بيانيًا الخسائر التي تكبّدها جيش نابليون في الحملة الروسية PANY ple‏ 
(انظر: الشكل dsl .)7٠-٠‏ من الحدود البولندية - الروسية» يوضّح الخط السميك حجم الجيش 
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في كلّ موقع. ويظهر مسار تراجع نابليون من موسكو في فصل الشتاء القارس من خلال الشريط 
السّغلي المظلم, المرتبط بدرجات الحرارة والفترات الزمنية. يقول خبير التصوير البياني والمؤلف 
والناقد الشهير إدوارد توفت أنَّ هذا «قد يكون أفضل رسم بياني إحصائي يتم رسمه على الإطلاق». 
في هذا الرسم البياني؛ تمّ تمثيل 811084 آنيًا بعدّة أا للبيانات (مثل: حجم الجيشء واتجاه 
الحركة» والمواقع الجغرافيةء ودرجة الحرارة الخارجيةء وما إلى ذلك) بطريقة فنية وإعلامية. وقد 
شهد القرن العشرون بزوغ سلوك جديد للتصوير البياني يتسمٌ بأنه أكثر رسميةً deas‏ والذي 
کان هيل إلى التركيز على جوانب» مثل: اللونء ومقاييس القيمةء ووضع العلامات. وفي منتصف 
القرن العشرين» أصدر رسام الخرائط والباحث النظري جاك بيرتين كتابه «علم الرسم البياني» 
والذي يقول عنه البعض: إنه يُعتبّر بمثابة الأماس النظري للتصوير الحديث للمعلومات. وعلى 
الرغم من أن معظم أنماطه قد تقادمت بسبب الأبحاث الحديثة أو عدم قابليتها للتطبيق بشكلٍ 
كامل على الوسائط الرقمية؛ فإِنَّ الكثير منها ما زال مناسبًا للغاية. 

ومع بدايات الألفية الجديدة؛ ظهر الإنترنت كوسيط جديد للتصوير البياني وجَلَّبَ معه الكثير 
من الجيل والقدرات الجديدة. وم يجعل التوزيع الرقمي كلا من البيانات والتصوير البياني على 
مستوى العام أكثر سهولةً للوصول إلى جمهور أوسع (أيّْ: زيادة محو الأمية المرئية)؛ بل حفّز 
أيضًا تصميم نماذج جديدة تتضمّن elid‏ والرسوم المتحركة» وعرض الرسومات البيانية للتقنية 
الفريدة من نوعها لشاشات الوسائطء وتغذية البيانات بشكلٍ فوري لإنشاء بيئات غامرة للتواصل 
واستهلاك البيانات. 

وقد اهتمّت الشركاثٌ والأفراد بالبيانات بشكلٍ مفاجئء وهذا الاهتمام أثارٌ بدوره الحاجة إلى 
أدوات مرئية تساعدهم على فهمها. وتعمل P‏ الاستشعار الرخيصة الثمن مع فلسفة «قم 
ببناء نظامك الخاص بنفسك» على تقليل تكاليف جمع البيانات ومعالجتها. وقد أذّى ظهور 
as‏ لا يُحصّى من التطبيقات الأخرىء وأدوات البرامج» ومكتبات الشفرة منخفضة المستوى إلى 
مساعدة الناس في جمع البيانات وتنظيمها ومعالجتها وتصويره ا وفهمها عمليًا من أيّ مصدر. 
وقد كان الإنترنت أيضًا بمثابة قناة توزيع رائعة للتصويرات البيانية؛ فقد تمّ تجميع مجموعة 
متنوعة من المُصمّمين والمبرمجين ورسامي الخرائط والمشتغلين بالصيانة» والبيانات ال مفككة لنشر 
كلّ أنواع الأفكار والأدوات الجديدة للعمل مع البيانات في كل من الأشكال المرئية وغير ا مرئية. 
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شکل ۲۰-۲: هلاك جيش نابليون في آثناء الحملة الروسية لعام ١١۸١م‏ 
كما JS $ Lo Syl Lá Google Jal, caa‏ من اتفاقيات الواجهة (انقر للتنقلء 
انقر نقرًا مزدوجًا للتكبير) والتقنية (خريطة بحجم ١01‏ بكسل مربع مع أسماء ملفات يمكن 
التنبؤ بها) لعرض الجغرافيا التفاعلية عبر الإنترنت» بالشكل الذي يعلم به معظم الناس ما يجب 
عليهم فعله عندما يتم 3 تقديم خريطة عبر الإنترنت. لقد قدَّم gia iaus Žur iaus Flash‏ 
لتصميم وتطوير تطبيقات إنترنت غنية وجميلة تتضمّن تصويرات وخرائط بيانات تفاعلية؛ وفي 
الوقت الحالي؛ بدأت تقنيات جديدة للمتصفحات ف الظهورء مثل: ٥۷‏ و5۷6 (والتي يتم 
تضمينها مجتمعةً في بعض الأحيان تحت مظلة 111311:5) لتحَذَّي السيادة التي حظي بها فلاش 
والعمل على زيادة فرص وصول واجهات التصوير المتحرك إلى أجهزة التليفون المحمولة. 
يصعب التنبؤ بمستقبل تصوير البيانات/ المعلومات. يمكننا فقط أن نستنتج مما تمّ اختراعه 
بالفعل: المزيد من التصوير ثلائي الأبعاد. وتجربة مليئة بالبيانات المتعددة الأبعاد في بيئة الواقع 
الافتراضي» والتصوير البياني المجسّم للمعلومات. وهناك فرصة جيدة بأن نرى شيئًا جديدًا لم 
نشهده من قبل في عام تصوير المعلومات الذي تم اختراعه قبل نهاية هذا العقد. وتوضّح الحالة 
العملية 7-7 كيف أن أدوات التحليلات/ التقارير المرئية مثل of lise Tableau‏ تساعد في 
تسهيل اتخاذ القرار بفعالية وكفاءة من خلال إنشاء ومشاركة المعلومات/ المعرفة. 
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حالة عملية 5-9 

ماكفارلان سميث يحسن رؤية الآداء التشغيلي باستخدIم Tableau Online‏ 
معلومات أساسية: 

حصل مكفارلان سميث على مكانة في التاريخ الطبي؛ إذ عقدت الشركة تعييئًا ملكيًا 
لتوفير الدواء لجلالة الملكة فيكتوريا وزوّدت أخصائي التوليد الرائد السير جيمس سيمبسون 
بالكلوروفورم لتجاربه في تخفيف الألم في أثناء المخاض والولادة. وتُعَد اليوم ماكفارلان 
سميث Fine Chemical å Så) å b Sè‏ وكاكتزله021 التابعة لشركة Johnson‏ 
zaad d Ml] G Eal ASil ga ig katl Sil i59 Matthey plc‏ 
المخدّر godd‏ مثل: الكودايين والمورفين. ويقوم موظفو مكفارلان سميث كل يوم باتخاذ 
قرارات بناءً على بياناتهم. فهم يقومون بجمع وتحليل البيانات التشغيلية للتصنيع» 
مثل بيانات تسمح لهم بتحقيق أهداف التحسين المستمر. وتعتمد كل من المبيعات 
والتسويق والتمويل على البيانات؛ لتحديد فرص الأعمال التجارية الدوائية الجديدة 
وتنمية العائدات الاستثمارية وتلبية احتياجات العملاء. وإضافةً إلى ذلك؛ يحتاج فرع 
الشركة في إدنبره إلى مراقبة بيانات الجودة واتجاههاء وإعداد تقارير عنها؛ لضمان هويتها 
وجودتها ونقاء ÍS‏ مكوناتها إلدوائية للعملاء والس لطات التنظيميةء مثل إدارة الغذاء 
والدواء الأمريكية (2524) وغيرها كجزءِ من ممارسات التصنيع الجيدة (CGMP)‏ 
التحديات: مصادر متعددة للحقيقة والبطء» وعمليات إعداد التقارير المرهقة: 

مم تكن عملية جمع تلك البيانات واتخاذ القرارات» وإعداد التقارير سهلةٌ على الرغم 
من ذلك. فقد كانت البيانات الخاصة بالنشاط التجاري مبعثرةً مما في ذلك توصيات 
الشركة بشأن تخطيط موارد المشروع (۴۸۴)» داخل قواعد البيانات الإدارية القدهة مثل 
«Access Ibla asl985 SQL‏ وجداول البيانات المستقلة. وعندما تم ghy‏ لهذه 
البيانات لصُنع القرار. تمّ تكريس وقت طويل جدًا وتخصيص موارد مفرطة للتنقيب قي 
البيانات ودمجها وعرضها في جدول بيانات (gl à sl‏ وسيلة عرض أخرى. 

وكانت جودة البيانات مصدر قلق آخر. ونظرًا لاعتماد فرق العمل على مصادرهم 
الفردية للبيانات؛ فقد كانت هناك إصدارات مُتعدّدة من الحقيقة والتعارضات بين 
البيانات. وكان من الصعب أحيانًا معرفة أيّ إصدار من البيانات كان صحيحًا وأيها لم 
يكن كذلك. 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 141 


الفصل الثاني 


لم يتوقف الأمرٌ عند هذا الحد؛ فحتى بعد جمع البيانات وعرضهاء كان إجراء 
تغييرات «على الطاير» بطيئًا وصعبًا. وفي الواقع؛ كلما حاول أحد أعضاء فريق ماكفارلان 
سميث عمل اتجاه للبيانات أو إجراء أيّ تحليل آخر؛ فإن التغييرات التي تطرأ على 
البيانات كانت تحتاج إلى الموافقة عليها. وكانت النتيجة النهائية هي أن البيانات كانت 
متقادمةً بشكلٍ مؤثر جدًا في الوقت الذي كانت تستخدم في صُنْعَ القرار. 

Jal uds‏ ليام ميلزء رئيس قسم التحسين المستمر في ماكفارلان سميثء الضوة على 
سيناريو نموذجي لإعداد التقارير؛ فيقول: «تتمثل إحدى عملياتنا الرئيسية في إعداد 
التقارير في الإجراء التصحيحي والإجراء الوقائيء أو CAPA‏ وهو عبارة عن تحليل 
لعمليات التصنيع في ماكفارلان سميث التي تم اتخاذها لإزالة أسباب عدم التوافق 
أو حالات أخرى غير مرغوب فيها. كما تمّ تخصيصٌ مئات الساعات كل شهر لسحب 
البيانات آنيًا من أجل 04128 - واستغرق الأمر أيامًا لإنتاج كل تقرير. وكان تحليلٌ 
الاتجاهات صعبًا xil‏ لأن البيانات كانت ثابتة (ساكنة). وفي سيناريوهات أخرى 
لإعداد التقارير, غالبًا ما كان يتحتم علينا انتظارٌ تحليل جدول محوري لجدول البيانات؛ 
والذي 3( تقديمه بعد ذلك في صورة رسم بيانيء كما منت طباعته. وتثبيته على الحائط؛ 
كي يراجعه الجميع بسهولة». 

كانت عمليات إعداد التقارير البطيئة والمكثفة للعمالة, والنسخ المختلفة للحقيقة 
والبيانات الساكنةء كانت كلها عوامل محفزة للتغيير. يقول ميلز: «شعر الكثيرون 
بالإحباط؛ لأنهم اعتقدوا أنهم ليس لديهم صورة كاملة عن العمل. لقد أجرينا الكثير 
والكثير من المناقشات حول القضايا التي واجهناها - عندما كان علينا التحدث عن 
تقارير ذكاء الأعمال». 
الحل: تصويرات البيانات التفاعلية: 

كان لدى أحد أعضاء فريق ماكفارلان سميث خبرة سابقة في استخدام نهعاطة1 
وأيضًا استكشاف الحلول الخُوصّى بها من قبل ميلز. وسرعان ما أقنعت نسخة تجريبية 
Online jo å olga‏ 12016203 ميلز بأنَّ حلّ إضافة التصوير التفاعلي للبيانات يمكنه 
التغلّب على مشكلات البيانات التي كانوا يواجهونها. 

ويضيف: «لقد فزت في الحال تقريبًا. فإن سهولة الاستخذام والآداء الوظيفي 
واتساع تصويرات البيانات كلها مثيرة جدًا للإعجاب. وبالطبع؛ كونها حلاً قائماً على 
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البرمجيات كخدمة (5385)؛ فإنه لا يُوجَد أي استثمار في البنية التحتية التقنية يمكننا أن 
نعيشه على الفور تقريبًاء وأيضًا لدينا المرونة لإضافة المستخدمين كلما احتجنا إلى ذلك». 

إن أحد الأمئلة الرئيسية التي يجبٌ الإجابة عنها تتعلق بأمان البيانات عبر الإنترنت. 
«لدى الشركة الأم جونس ون ماني إستراتيجية السحابة؛ ولكن يجب أن نكون متأكدين من 
أن إضافة أيّ حل آمن تمامًا. إن gil Ja a3 zs Tableau Online cil.‏ الفردي 
والسّماح للمستخدمين المصرّح لهم فقط بالتعامل مع البيانات توفر الأمان والثقة اللازمين». 

أمّا سؤال الأمان الآخر الذي كان ماكفارلان سميث وجونسون مائي يريدان الإجابة عنه: 
أين يتم تخزين البيانات ماديًا؟ يضيف ميلز: «نحن راضون عن أداء Tableau Online‏ 
والذي يستوف المعايير الخاصة بنا لأمان البيانات والخصوصية؛ إذ تتم استضافة البيانات 
والمصنّفات في مركز بيانات دبلن الجديد في Tableau‏ لذلك فهي لا تغادر أوروبا «lj‏ 

وبعد تجربة دامت ستة أسابيع» عمل خلالها مدير المبيعات 3( Xo ga Tableau‏ 
وفريقه لبناء قضية تجارية ل عهئآه0 نله»1ط12, وافق فريق الإدارة على ذلك على الفورء 
وبدأ برنامج تجريبي يضم ٠١‏ مستخدمين. وشملت التجربة مبادرة لتحسين جودة التصنيع: 
بالنظر إلى الانحرافات عن القاعدة, كأن يتجاوز جهاز التسخين المستخدّم في عملية تصنيع 
المخدرات الأفيونية درجة الحرارة. من هذا المنطلق؛ تمّ إنشاء لوحة معلومات «عمليات 
الجودة» لتتبّع وقياس الانحرافات ووضع إجراءات لتحسين الجودة والأداء التشغيلي. 

يقول ميلز: «أشارت لوحة المعلومات هذه على الفور إلى أماكن الانحرافات. لم نكن 
ننشط عبر صفوفٍ من البيانات - لقد توصّلنا إلى إجابات فورية». 

وخلال هذه التجربة الأؤّلية والتجريبية؛ استخدم الفريق أدوات التدريب ننهءاطه1, 
مثل مقاطع الفيديو التدريبية المجانيةء وإرشادات المنتجات والتدريب المباشر عبر 
الإنترنت. كما شاركوا في حدث «التدريب الأساسي» على مدى يومين في لندن. ووفقاً 
لميلز: «كان التدريب دقيقًا وموجهًا فقط على المستوى الصحيح. وقد أظهر للجميع 
فقط مدى سهولة Tableau Online‏ فقد أصبح بإمكاننا تصوير ٠١‏ سنوات من 
البيانات في عدد قليل من النقرات». لدى الشركة الآن خمسة مستخدمين لسطح مكتب 
klg Tableau‏ يصل إلى ٠٠٠١‏ مستخدم مرخص ل #هذام0 تندعاطة1. 

pex loo A, Jay! d Tableau Union ga 4& 35 5l 4-49 ple "em‏ لھم 
ضمٌ البيانات التي تمّ تقسيمها إلى ملفات صغيرة. ويضيف: «من الصعب أحيانًا تجميع 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري AF‏ 


الفصل الثاني 


البيانات التي نستخدمها للتحليل؛ إذ تتيحٌ لنا مَيْرَة الاتحاد العمل مع البيانات المنتشرة عبر 
عدة علامات تبويب أو ملفات؛ مما يقلل من الوقت الذي نقضيه في إعداد البيانات. 
النتائج: تحليلات السّحابة تقوم بتحويل صُنع القرار وإعداد التقارير: 
من خلال توحيذ المعايير Tableau Online dle‏ حول ماكفارلان سميث سرعة 
ودقة اتخاذ القرار وإعداد تقارير الأعمال. وهذا يتضمّن: 
- يمكن إنتاجُ لوحات تفاعلية جديدة خلال ساعة واحدة. في السابق؛ كان يستغرق الأمرٌ 
أيامًا لدمج البيانات وعرضها في جدول بيانات ثابت. 
- يمكن الآن e]‏ تقرير عملية تصنيع 041284 في دقائق. والذي كان يستغرق إنتاجه في 
السابق المئات من ساعات العمل كل شهر - مع الأفكار المشتركة في السحابة. 
- يمكن تغيير التقارير والاستعلام «على الطاير» بسرعة وسهولةء دون تدخل تقني؛ إذ يتمتع 
ماكفارلان سميث بال مرونة لنشر لوحات المعلومات مع اهءاطة1. ومشاركتها مع الزملاء 
أو الشركاء أو العملاء. 
- تمتلك الشركة نسخةً واحدةً وموثوقةً من الحقيقة. 
- تجري ماكفارلان سميث حاليًا مناقشات حول بياناتها - وليس حول القضايا المتعلقة 
بتكامل وجودة البيانات. 
- يمكن جلب المستخدمين الجدد عبر الإنترنت على الفور تقريبًا - وليس هناك بنية أساسية 
تقنية لإدارتها. 
وبعد هذا النجاح المبدثي؛ يقوم ماكفارلان سميث الآن بتوسيع نطاق 
Tableau Online‏ إل إعداد التقارير الطماليةء وتحليلات سلاسل التوريد وتوقعات 
المبيعات. ويختتم ميلز قائلًا: «تستند إستراتيجية أعمالنا الآن على قرارات تعتمد 
على البيانات وليس على الآراء. كما ممُكُننا التصويرات التفاعلية من تحديد الاتجاهات 
بشكل فوريء وتحديد التحسينات في العملية واستخلاص ذكاء الأعمال إلى المستوى 
التالي. أستطيع الآن تعريف «Tableau ld) (zo‏ 
أسئلة للمناقشة: 
-١‏ ما هي التحديات المتعلقة بالبيانات وإعداد التقارير التي واجهت ماكفارلان 


$Macfarlan Smith css 
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Blag Jal ga Lo -Y‏ كانت النتاتج/ الفوائد التي S‏ الحصول عليها؟ 
Source: Tableau Customer Case Study, “Macfarlan Smith improves operational‏ 
performance insight with Tableau Online? http://www.tableau.com/stories/customer/‏ 
macfarlan-smith-improves-operational-performance-insight-tableau-online (accessed‏ 


October 2016). 


أسئلة مراجعة على القسم A-Y‏ 

-١‏ ما هو تصوير البيانات؟ وماذا يتم الاحتياج إليه؟ 

-V‏ ما هي الجذورٌ التاريخية لتصوير البيانات؟ 

dle -*‏ بعناية تصوير تشارلز جوزيف مينارد الرسمى مسيرة نابليون. مع تحديد والتعليق على 
جميع أبعاد المعلومات التي تمَّ التقاطها في هذا الرسم البياني القديم. 

©- مَنْ هو إدوارد توفت؟ وبرأيك لماذا علينا أن نتعرف على ما قام به من عمل؟ 

-٥‏ ما هو في رأيك «الشيء الكبير التالي» في تصوير البيانات؟ 


٩-۲‏ الأنواع المختلفة للمخططات والرسوم البيانية: 

غالباً مايكون المستخدمون النهائيون لأنظمة تحليلات الأعمال غير متأكدين من نوع الرسم 
البياني أو الجدول البياني الذي يجب أن يستخدموه لغرض معين؛ إذ تكون بعض الرسوم أو 
الجداول البيانية هي أفضل في الإجابة عن أنواع معينة من الأسئلة؛ فقد يبدو بعضها أفضل 
من غيرها ويبدو البعض الآخر بسيطًء ويكون البعض الآخر معقدًا ومزدحمًا إلى حَدَ ما. وفيما 
يلي وصفٌ موجرٌ لأنواع الرسوم البيانية و/ أو الجداول البيانية الشائعة في معظم أدوات تحليل 
الأعمال وأنواع الأسئلة التي هي أفضل في الإجابة/ التحليل. وقد تمّ تجميعٌ هذه المواد من العديد 
من المقالات المنشورة وغيرها من المنشورات (أبیلا ۲۰۰۸؛ هاردن ۲۰۱۲؛ ساس ۲۰۱۴؛ وآخرون). 


المخططات والرسوم البيانية الأساسية: 
فيما يلي المخططات والرسومات البيانية الأساسية التي تُستخدّم عادةً لتصوير المعلومات. 


(Line Chart) ghd! ewl hò‏ هو الصور البيانية الأكثر استخدامًا تبيانات السلاسل 
الزمنية. وتوضّح المخططات الخطية (أو الرسوم البيانية الخطية) العلاقة بين متغيرين؛ وغالبًا ما يتم 
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استخدامها لتتبّع التغييرات أو الاتجاهات عبر الوقت (تعيين أحد المتغيرات إلى الوقت على المحور 
السيني). وتعمل المخططات الخطية على توصيل نقاط بيانات فردية بشكل متعاقب للمساعدة 
في استكشاف الاتجاهات المتغيرة على مدار فترة زمنية. وغالبًا ما يتم استخدام المخططات الخطية؛ 
لإظهار التغييرات المعتمدة على الوقت في قيّمِ بعض المقاييس» مثل: التغييرات على سعر سهم معين 
على مدار © سنوات أو تغييرات على عدد المكالمات اليومية لخدمة العملاء على مدار الشهر. 
شريط :(Bar Chart) GUI ea JI‏ 355 من أكثر العناصر الأساسية الأكثر استخدامًا لتمثيل 
البيانات. تكون الرسوم البيانية الشريطية فعّالة عندما يكون لديك بيانات اسمية أو بيانات رقمية 
تنقسم بشكل جيدٍ إلى فئات مختلفة؛ بحيث يمكنك مشاهدة النتائج والاتجاهات النسبية في بياناتك 
بسرعة. وغالبًا ما يتم استخدام المخططات الشريطية لمقارنة البيانات عبر فئات متعددة مثل النسبة 
المئوية للإنفاق الإعلاني بحسب الأقسام أو بحسب فتات المنتجات. يمكن أن تكون المخططات الشريطية 
عموديةٌ أو أفقية. ويمكن أيضًا تحزمها بعضها فوق بعض؛ لإظهار أبعاد متعددة في مخطط واحد. 
الرسم البياني الدائري (0181 816): وكما يوحي اسمها؛ فهي تكون جذَّابة للعين» مخطط 
دائري الهيئة. ولأنها جذابة جذًا؛ فغالبًا ما دُستَخدَم بشكل غير صحيح. فعلى سبل اممثال: هكن 
استخدامها لعرض النسبة المئوية النسبية لميزانية الإعلان التي يتم إنفاقها على خطوط الإنتاج 
المختلفة» أو يمكن أن تظهر النْسَب النسبية من التخصصات التي التحق بها طلاب الجامعات في 
سنتهم الدراسية الثانية. فإذا كان عدد الفئات المراد إظهارها كبيراً إلى خَذّ ما (على سبيل المثال: أكثر 
من أربعة)؛ فيجب التفكير بجدية في استخدام شريط الرسم البياني بدلا من الرسم البياني الدائري. 
Plot) iel gyo‏ ©]562): غالبًا ما يتم استخدامها لاستكشاف العلاقة بين متغيرين أو 
ثلاثة (في الصور ثنائية الأبعاد). ولأنها أدوات استكشاف بصريةء ولديها أكثر من ثلاثة متغيرات؛ 
فإن ترجمتها إلى أكثر من ثلاثة أبعاد لا يمكن تحقيقها بسهولة. وهي وسيلةٌ فعَالةٌ لامتكشاف 
وجود الاتجاهات والتركيزات والقيم المتطرفة. فعلى سبيل المثال: في الرسم البياني ذي المتغيرين 
(المحورين)» يمكن استخدام مربع التبعثر لتوضيح علاقة الارتباط بين عُمْر ووَزْن مرضى القلبء أو 
يمكن أن يوضّح العلاقة بين عدد ممثلي خدمة العملاء وعدد مطالبات خدمة العملاء المفتوحة. 
وفي كثيرٍ من الأحيان؛ يتم فر خط اتجاه على مربع التبعثر ثنائي الأبعاد لتوضيح طبيعة العلاقة. 
الرسم البياني الفقاعي (Bubble Chart)‏ هي غالبًا ما تكون عبارة عن نسخة مُحسّنة من 
مربع التبعثر. وعلى الرغم من ذلك؛ فهي لا تُحَدُ نمطًا مرئيًا جديدًا؛ بل ينبغي النظر إليها على 
أنها تقنيةٌ لإثراء البيانات الموضّحة في مخططات التبعثر (أو حتى الخرائط الجغرافية). ومن 
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خلال تفاوت حجم و/ أو لون الدوائر؛ يمكن إضافةٌ أبعاد إضافية للبيانات؛ مما يعطي معنّى أكثر 
إثراءَ حول البيانات. فعلى سبيل المثال: يمكن استخدامٌ رسم بياني فقاعي؛ لإظهار عرض تنافسي 
لحضور الفصل الدراسي على مستوى الكلية حسب التخصص, وحسب الوقت من اليوم؛ أو يمكن 
استخدامه لعرض هامش الربح حسب نوع المنتج وحسب المنطقة الجغرافية. 


المخططات والرسوم البيانية المتخصصة: 

إن الرسوم والمخططات البيانية التي نراجعها في هذا القسم؛ إما مستمدة من المخططات 
الأساسية كحالات خاصة: أو أنها جديدةٌ نسبيًاه وهي خاصةٌ بنوع المشكلة أو منطقة التطبيق. 

a (Histogram) gh gah!‏ الناحية البيانية» يبدو المدرج التكراري وكأنه شريط 
رسم بياني (bar chart)‏ ويكمّن الفرق بينهما فقط في المعلومات التي يتم تصويرها. ويتم 
استخدامٌ المدرج التكراري 5 لإظهار التوزيع التكراري ملتغيرٍ أو لعدة متغيرات. في المدرج التكراري» 
غالبًا ما يُستَخدّم المحور السيني لإظهار الفئات أو النطاقات؛ في حين يتم استخدامٌ المحور الصادي 
لإظهار المقاييس/ القيم/ التكرارات. يُظهر المدرج التكراري 5 الشكل التوزيعي للبيانات. وبهذه 
الطريقة؛ من الممكن إجراء فحص بصري لتوزيع البيانات لمعرفة ما إذا كانت موزعةٌ توزيعًا 
طبيعيًا أو أسيًا. فعلى سبيل المثال: يمكن استخدامٌ المدرج التكراري لتوضيح lol‏ اختبار الفئة؛ إذ 
يمكن عرضٌ توزيع الدرجات إضافةً إلى التحليل المقارن للنتائج الفردية, أو هكن استخدام المدرج 
التكراري لعرض توزيع أعمار قاعدة العملاء. 

الرسم البياني (Gantt) cale‏ هي حالة خاصة من شرايط الرسومات البيانية الأفقية التي 
تُستخدم لتصوير الجداول الزمنية للمشروع ومدة مهام/ نشاط المشروع» والتداخل بين المهام/ 
الأنشطة. ومن خلال عرض تواريخ/ أوقات البدء والانتهاء للمهام/ للأنشطة والعلاقات المتداخلة؛ 
تُقَدّم رسومات جانت مساعدات لا تُقَدَّر بثمن لإدارة المشاريع والتحكّم فيها. فعلى سبيل JMI‏ 
zs la Ul‏ استخدامٌ مخططات جانت لعرض المخططات الزمنية للمشروع وتداخلات المهامٌ 
وإكمال المهامٌ النسبية (شريط جز يُوضْح نسبة الإكمال داخل شريط يعرض المدة الفعلية 
للمهمة) والموارد المخصصة لكل مهمة والمعالم والإنجازات. 

(Pert) S edle‏ (وتُسمّى أيضًا الرسوم البيانية للشبكة). ويتم تطويرها في المقام 
الأول؛ لتبسيط التخطيط وجدولة المشاريع الكبيرة والمعقدة. وهي تُظهر علاقات الأسبقية بين 
أنشطة/ مهام المشروع. يتكوّن الرسم بيرت من عَقَد (ممثلة بدوائر أو مستطيلات) وحواف 
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(ممثلة بالأمهم الموجهة). cde Flug‏ ما هو متعارف عليه بالنسبة لبيرت؛ فإنه يمكن استخدامٌ 
العقد أو الحوافٌ لتمثيل أنشطة/ مهام المشروع (مخطط النشاط على أساس العقّد مقابل النشاط 
على أساس التمثيل السهمي). 

الخريطة الجغرافية (م02 عنطمهمع6»0): عندما تتضمّن مجموعة البيانات أي نوع من 
بيانات الموقع (مثل: العناوين المادية» أو الرموز البريدية» أو أسماء الولايات» أو الاختصارات» أو 
أسماء الدول» أو خطوط العرض/ الطولء أو بعض أنواع الترميز الجغرافي المخصص»» ويكون من 
الأفضل والأكثر فائدةٌ الاطلاع على البيانات على خريطة. وعادةً ما يتم استخدام الخرائط بالتزامن 
مع الرسوم والمخططات البيانية الأخرىء بعضها في مقابل بعض. فعلى سبيل المثال: يمكن استخدامٌ 
الخرائط لعرض توزيع طلبات خدمة العملاء على حسب نوع المنتج (الموضّح في الرسوم البيانية 
الدائرية) على حسب المواقع الجغرافية. وفي كثير من الأحيان؛ يمكن تصويرٌ مجموعة كبيرة من 
المعلومات (مثل: التوزيع العمريء أو توزيع الدخلء أو التعليم, أو النمو الاقتصاديء أو التغيرات 
السكانية) في خريطة جغرافية واحدة؛ للمساعدة في اتخاذ قرار بمكان فتح مطعم جديدء أو إنشاء 
محطة خدمة جديدة. وغالبًا ما تُسمََى هذه الأنواع من النظم بنظم المعلومات الجغرافية (15©). 

مُخططات بولت (01160ا183): غالبًا ما يت استخدام مخططات 1166ناا؛ لإظهار التقدَّم نحو 
الهدف. وهي في الأساس شكلٌ من أشكال شريط الرسم البياني. وغالبًا ما يتم استخدامها بدلا من 
المقاييس» والعدادات» ومقاييس الحرارة في لوحة اللمعلومات لتوصيل المعنى المراد توصيله بشكل 
أكثر بديهية ضمن مساحة أصغر بكثير. تقارن مخططات اا8 مقياسًا أساسيًا (مثل: الإيرادات 
السنوية) مع واحد أو أكثر من المقاييس الأخرى (مثل: هدف الإيرادات السنوي)» وتقدم ذلك في 
سياق مقاييس أداء معينة (مثل: حصص المبيعات). ويمكن لمخططات of Bullet‏ توضّح بشكلٍ 
بديهي كيفية أداء الإجراء الأساسي مقابل الأهداف العامة (مثل: مدى قرب مندوب المبيعات من 
تحقيق حصته السنوية). 

الخريطة الحرارية (م38 11626): تُعَدَ الخرائط الحرارية عناصر مرئية رائعة؛ لتوضيح المقارنة 
بين القيم المستمرة عبر فئتين باستخدام اللون. ويكون الهدف منها هو مساعدة المستخدم على 
المشاهدة السريعة للمكان الذي يكون فيه تقاطع الفنات أقوى وأضعف من حيث القيم العددية 
للمقياس الجاري تحليله. فعلى سبيل المثال: من الممكن استخدامٌ خرائط الحرارة؛ لإظهار تحليل 
تقسيم الأمواق المُستهدفة؛ بحيث يكون المقياس هو مبلغ الشراء (والذي يتم تمثيله بالتدرج 
اللوني)ء وتكون الأبعاد هي العمر وتوزيع الدخل. 
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Shodi hiha stsl dI JABI Jalas agso (Highlight Table) JAA Jalas 
خطوة أخرى إلى الأمام. فإضافةً إلى إظهار كيفية تداخل البيانات باستخدام اللون؛ تضيف جداول‎ 
أطعالطع:118 رقمًا في الأعلى لتقديم تفاصيل إضافية. أي إنها جداول ثنائية الأبعاد ذات خلايا‎ 
مملوءة بقيم رقمية وتدرجات لونية. فعلى سبيل المثال: من الممكن عرض أداء مندوبي المبيعات‎ 
على حسب نوع المنتج وحجم المبيعات.‎ 

الخرائط الشجرية (م242 »16): وهي تعرض البيانات الهرمية (المهيكلة بشكلٍ شجري) 
كمجموعة من المستطيلات المتداخلة. إذ يتم إعطاء كلّ فرع من الشجرة مستطيلا. والذي يتم 
بعد ذلك تقاربه مع مستطيلات أصغر تمثل الفروع. ويحتوي مستطيل عقدة الورقة على مساحة 
تتناسب مع بُعد مُحدّد في البيانات. وغالبًا ما يتم تلوين عُقد الأوراق؛ لإظهار بُعد منفصل للبيانات. 
وعندما ترتبط أبعاد اللون والحجم بشكلٍ أو بآخر مع هيكل الشجرة؛ فيمكن بسهولة رؤية الأفاط 
التي يصعب اكتشافها بطرق أخرىء كأن يحظى لون معين بأهمية خاصة. أما الميزة الثانية لخرائط 
الأشجار؛ فهي أنها تستخدم الفضاء بكفاءة؛ وذلك عن طريق الشكل الهندسي الذي تتمتع به. 
ونتيجةٌ لذلك؛ فيمكنها عرض آلاف العناصر بشكل مقروء وواضح على الشاشة في وق واحد. 


iei‏ مخطط أو رسم بياني يجب أن تستخدمه؟ 

ما هو الأفضلء فيما شرحناه سابقاً ا مخطط أم الرسم البياني؟ الإجابة سهلة إلى حَدَّ ما: فلا 
bhia sbgh‏ أو رسمٌ بياني واحد هو الأفضل على الإطلاق؛ فلو كان الأمرُ كذلك لما كان لدينا هذا 
eSI‏ الكثيدُ من أنواع الرسومات والمخططات البيانية. فلدى كل واحد منها «مهارات» مختلفة 
بعض الشيء في تمثيل البيانات عن الآخر. لذلك؛ ينبغي أن يكون السؤال الصحيح هو: «أيّ 
مخطط أو رسم بياني هو الأفضل للهمة معينة؟» ويمكن أن تساعد إمكانات المخططات المومّحة 
في القسم السابق في اختيار واستخدام الرسم / المخطط البياني ا مناسب لكل مهمة؛ ولكن يظل 
من الصعب فرزها. كما يمكن استخدامٌ عدة أنواع مختلفة من الرسوم/ المخططات البيانية لنفس 
مهمة التمثيل التصويري. وتُعَد إحدى القواعد الأساسية هي اختيار واستخدام أبسط البدائل 
لتسهيل فهم الجمهور المقصود واستيعابه. 

على الرغم من عدم وجود خوارزمية مقبولة وشاملة على نطاقٍ واسع لاختيار وتصنيف المخطط/ 
الرسم البيانيء يُقدُم الشكل ؟-1١؟‏ تنظيمًا شاملا ومنطقيًا إلى حدّ كبير لأنواع المخططات/ الرسوم 
البيانية في بنية شبه تصنيفية (نُشرت النسخة الأصلية منه في أبيلا .)7٠١8‏ ويجب أن يتم تنظيم 
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البنية التصنيقية بالشكل الذي يجيب عن السؤال التالي: «ما الذي ترغبٌ في إظهاره في الرسم/ 
المخطط البياني؟» بمعنى؛ ماذا سيكون الغرض من الرسم/ المخطط البياني. وعلى هذا المستوى؛ يقوم 
التصنيف بتقسيم الغرض إلى أربعة أنواع مختلفة - العلاقة والمقارنة والتوزيع والبنية - كما يُقسّم 
الفروع إلى فئات فرعية بناءً على عدد المتغيرات المتضمنة والاعتماد على الوقت في التصوير المرقي. 
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Communication that drives action. Newyork: wiley 
شكل 1-8؟: تصنيف الرسوم والمخططات البيانية‎ 

على الرغم من أن هذه الرسوم وا مخططات البيانية تغطي ljo‏ كبيرًا مما هو شائع الاستخدام 

في تصوير ا معلومات؛ فإنها لا تغطي كلّ ما يتعلق بهذا الموضوع. وفي الوقت الحاضر يمكننا إيجادٌ 
العديد من الرسوم والمخططات البيانية المتخصّصة الأخرى التي تخدم غرضاً معيناً. علاوةً على 
ذلك؟ يتمثل الاتجاه الحالي في دمج/ تهجين وتحريك هذه الرسوم البيانية؛ للحصول على رؤية 
أفضل وأكثر بديهية لمصادر البيانات المعقدة والمتقلّبة اليوم. فعلى سبيل المثال: توفر الرسوم 
البيانية من نوع 11012 والرسوم التفاعلية» والرسوم المتحركة والمتاحة على موقع Gapminder)‏ 
Bs Al 145 (gapminder.org‏ للاهتمام لاستكشاف بيانات الصحة والثروة والسكان من منظور 
مُتعدّد الأبعاد. ويوضّح الشكل 77-8 أنواع الشاشات المتوفرة في الموقع. ويوضّح هذا الرسم البياني 
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كلا من حجم السكانء ومتوسط العمر المتوقع» ونصيب الفرد من الدخل على مستوى القارة؛ كما 
يتم عرض رسوم متحركة متغيرة بمرور الوقت توضّح كيفية تغيّر هذه المتغيرات بمرور الوقت. 
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شكل :YY-Y‏ مخطط رسم جغرافي يُظهر ثروات وصحة الأمم 


أسئلة مراجعة على القسم :9-٠‏ 

-١‏ من وجهة نظركء اذا يُوجَد هناك العديدٌُ من الأنواع المختلفة من الرسوم والمخططات البيانية؟ 

1- ما هي الاختلافات الرئيسية بين الرسوم الخطية والشريطية والدائرية؟ ومتى يجب عليك 
استخدام أحدهم دون الآخر؟ 

-Y‏ اذا تستخدم الخريطة الجغرافية؟ وما هي أنواع الرسوم البيانية الأخرى التي يمكن دمجها 
مع خريطة جغرافية؟ 

-٤‏ أوجد واشرح دور نوعين من الرسوم البيانية التي لم يتم تغطيتها في هذا القسم. 

٠١-۲‏ نشأة التحليلات المرئية: 


كما لاحظ سيث غراهز (2009 طره)» هناك «ذوق متزايد» من تقنيات وأدوات تصوير البيانات 
التي تمكّن مُستخدمي تحليلات الأعمال وأنظمة ذكاء الأعمال من تحسين «علاقات الاتصالء وإضافة 


سياق تاريخي» Ais‏ الارتباطات الخفيةء وسرد قصص مقنعة توضح العمل وتدعو لاتخاذ إجراء». 
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كما تؤكد أحدث إصدارات 0120826 Magic‏ على منصات ذكاء الأعمال ومنصات التحليلات 
à Gartner 5e 3S aal‏ فبراير 17١٠م‏ على أهمية تمثيل البيانات في ذكاء الأعمال والتحليلات. 
وكما يوضّح الرسم البيافي؛ فإن جميع مقترحي الحلول وأصحاب الرؤى في الشركات القيادية هم 
إما شركات تصوير معلومات حديثة التأسيس نسبيًا (مثل: برمجيات (QOlikTech 5| Tableau‏ 
أو شركات تحليلات كبيرة وراسخة (مثل مايكروسوفت (1110501): و545: JBMs‏ و84 و 
qh (MicroStrategy Alteryx‏ ترگز جهودها "e‏ متزايد على تصوير المعلومات والتحليلات 
المرئية. وتعرض الرؤية الفنية ؟-" تفصيلاً لأحدث ما صدر من .Gartner J Magic Quadrant‏ 

في ذكاء الأعمال والتحليلات, تمحورت التحَدَّيات الأساسية لتصوير البيانات حول التمثيل 
البديهي لمجموعات البيانات الكبيرة والمعقدة ذات الأبعاد والمقاييس المتعددة. وبالنسبة للجزء 
الأكبر. عادةً ما تتضمّن المخططات والرسوم البيانية النموذجية والعناصر المرئية الأخرى المستخدّمة 
في هذه التطبيقات بُعدَّينء وأحيانًا ثلاثة أبعاده ومجموعات فرعية صغيرة جدَّا من مجموعات 
البيانات. في المقابل؛ فإن البيانات الموجودة في هذه الأنظمة موجودة في مستودع البيانات. وكحد 
أدفى؛ تتضمّن هذه المستودعات نطاقاً من الأبعاد (مثل: المنتج. ا موقع الهيكل التنظيمي» الوقت)» 
ومجموعة من المقاييسء وملايين من خلايا البيانات. وفي محاولة للتصّدَّي لهذه التحَدّيات طوّر 
عددٌ من الباحثين مجموعةً متنوعةٌ من تقنيات التصوير الجديدة. 

رؤية فنية Y-Y‏ 
جارتنر ماجيك كوادرانت لمنصّات ذكاء الأعمال والتحليلات 

sd‏ جارتنر-إنك المؤسس لشركة ماجيك كوادرانت. وهي شركةٌ رائدةٌ في مجال أبحاث 
واستشارات تقنية المعلومات للتداول العَلَّنِي في الولايات المتحدة بعائدات سنوية تجاوزت ١‏ مليار 
دولار في عام 16١٠!م.‏ وقد e YAVA ee d c£ adl‏ وكان لديها آنذاك ٠٠١‏ شريك. بما في ذلك 
٠٠١‏ محلل واستشاري أبحاث والعديد من العملاء في 60 دولة. ويُّعَدُ ماجيك كوادرانت أسلوبَ 
بحث قام بتصميمه وتنفيذه جارتنر لمتابعة وتقييم التقدّم الحاصل ومراكز الشركات في سوق 
مُحدّدة قائمة على التقنية. ومن خلال تطبيق المعالجة الرسومية ومجموعة مُوحّدة من معايير 
التقييم» وتساعد ماجيك كوادرانت المستخدمين على فهم كيفية تقبيم مُقدَّمِيٍ التقنية في السوق. 

قامت غارتنر بتغيير اسم ماجيك كوادرانت من «منصات ذكاء الأعمال» إلى «منصات ذكاء 
الأعمال والتحليلات»؛ للتأكيد على الأهمية المتزايدة لقدرات التحليلات لنظم المعلومات التي تبنيها 
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المنظمات الآن. تحَدَّد جارتنر سوقاً لمنصة ذكاء الأعمال والتحليلات كمنصة برمجية تقوم بتوفير 
٥‏ إمكانية عبر ثلاث فئات» وهي: التكاملء وتسليم المعلومات» والتحليل. تكن هذه الإمكانيات 
المؤسسات من بناء أنظمة دقيقة للتصنيف والقياس؛ بغرض دعم صُنع القرار وتحسين الأداء. 

ويُوضّح الشكل 77-8 أحدث نظام لماجيك كوادرانت الخاص بمنصات ذكاء الأعمال والتحليلات. 
إذ تضع ماجيك كوادرانت مُقدِّمِي الخدمات في أربع مجموعات (اللاعبين المتخصّصين» وأصحاب 
التحَدّيء والحالمين» والقادة) على محورين هما: اكتمال الرؤية (المحور السيني) والقدرة على 
التنفيذ (المحور الصادي). وكما يظهر كوادرانت بشكل واضح؛ فإن معظم مُقدَّمِي 81/84 
المعروفين جيدًا يتم وضعهم في فتة «القادة», في حين 5 وَضْع العديد من مُقدَّمِي الخدمات 
الناشئة الأقل شهرةً والجديدة نسبيًا في فئة «اللاعبين المتخصصين». 

يبدو أنَّ التحول في سوق منصة ذكاء الأعمال والتحليلات مُتعدّد السنوات من التقارير التي 
تقودها تقنية المعلومات إلى تحليلات الخدمات الذاتية التي تقودها الشركات قد اجتاز نقطة التحول. 
إن معظم عمليات الشراء الجديدة هي من منصات التحليلات اللرئية الحديثة, المرتكزة على الأعمال 
التجارية؛ مما يؤدي إلى فرض منظور سوقي جديدء يعمل على إعادة ترتيب وجهة نظر البائعين 
Si‏ ملحوظ. إِنَّ معظم النشاط في سوق منصة ذكاء الأعمال والتحليلات هو من المؤسسات 
التي تحاول رفع قدراتها التصويرية والانتقال من النسق الوصفي إلى مستويات التحليلات التنبؤية 
والمفروضة. وقد ركز البائعون في السوق بشكل كبيرٍ على تلبية طلب المستخدم. وإذا كان هناك 
سوق واحد في عام ١٠١۲م؛‏ فسيصبح اكتشاف/ تصوير البيانات هو فن الهندسة المعمارية السائد. 
وفي الوقت الذي يعمل فيه مُورّدو اكتشاف/ تصوير البيانات» مثل: 1111 و)ذاQ‏ ومايكروسوفت 
e (Microsoft)‏ ترسيخ مراكزهم كقادة لكوادرانت: يحاول آخرون (سواءً من مُقدَّمِي الحلول/ 
الأدوات الناشئين والكبار أو الراسخين) الانتقال من طور أصحاب الرؤى إلى طور القادة. 

يستمر هذا التركيز على اكتشاف/ تصوير البيانات من معظم القادة وأصحاب الرؤى في السوق 
- التي تعمل الآن على تعزيز الأدوات مع تكامل البيانات سهلة الاستخدام من جانب الشركات. إلى 
جانب التخزين المُدمَجٍ وطبقات الحوسبة والحفر غير القيّد - في تعجيل الاتجاه نحو اللامركزية 
وتمكين المستخدم من ذكاء الأعمال والتحليلات. ويُعضّد إلى حَد كبير قدرة المنظمات على إجراء 
Source: Gartner Magic Quadrant, released on February 4, 2016, gartner.com (accessed‏ 


August 2016). 
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شکل ۲-۲۳: 01120211 ءذع 242 لمنصات ذكاء الأعمال والتحليلات 

التحليلات المرئية: 

تُعرّف التحليلات المرئية بأنها عبارة عن مصطلح تمّ صياغته مؤخرًا وغالبًا ما يُستَخِدّم بشكلٍ لا 
يعني شيئًا أكثر من التصوّر المعلوماتي. والمقصود بالتحليلات اللرئية؛ هو مزيجٌ من تصوير البيانات 
والتحليلات التنبؤية. ففي حين يهدف تصويرٌ المعلومات إلى الإجابة عن الأسئلة التالية: «ماذا 
حدث؟» و«ما الذي يحدث؟» ويرتبط ارتباطًا وثيقًا ب ذكاء الأعمال (التقارير الروتينيةء وبطاقات 
الأداءء ولوحات المعلومات). في حين تستهدف التحليلات المرئية الإجابة عن الأسئة: «لماذا يحدث 
هذا؟» و«ما هو الاحتمال الأكبر أن يحدث؟» وعادةٌ ما يرتبط بتحليلات الأعمال (التوقع» التقسيم 
إلى قطاعاتء تحليل الارتباط). ويضيف العديدٌ من مُورّدي تصوير المعلومات القدرات التي 
تجعلنا نطلق عليهم اسم مُوفَّري حلول التحليلات المرئية. يقترب معهد 545 - وهو أحد كبار 
مزوّدي حلول التحليلات منذ فترة طويلة - من اتجاه آخر؛ فهم يدمج ون قدراتهم التحليلية في 
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بيئة تصوير بيانات عالية الأداء والتي يُطلقون عليها التحليلات المرئية. ولا يختلف إعدادٌ تقارير 
الأعمال كثيرًا عن سَرْد القصة من حيث كونه مرئيًا أو غير مرثيء آلا أو يدويًاء عبر الإنترنت أو على 
الورق. وتعرض الرؤية Y-Y AJ‏ وجهة نظر مختلفة وغير تقليدية لتحسين تقارير الأعمال. 
رؤية فنية ۲-۲ 
سرد قصص عظيمة باستخدام البيانات والتصوير dol!‏ 

هتلك كل مَنْ لديه بيانات لتحليلها قصضًا ليرويهاء سواء كانت تش à Jed vol ul ual‏ 
التصنيع» أو تبيع فكرةً جديدةً بطريقة تعكس خيال الجمهور المستَهدّفء أو تعطي الزملاء 
فكرةٌ عن برنامج تحسين خدمة عملاء معين. وعندما يتمَخّض سَرْد قصة ما عن خيار إستراتيجي 
كبير يمكّنك أنت وفريق الإدارة العليا التابع لك من اتخاذ قرار قوي؛ فإِنَّ تقديم قصة تستنلٌ 
إلى الواقع قد يكون أمرًا صعبًا للغاية. وفي جميع الحالات؛ فهي مهمةٌ كبيرة. فعليك أن تكون 
القصة مثيرةً للاهتمام وعالقةً بالذاكرة. فأنت تعلم أنك بحاجة إلى أن تُبقي الأمر بسيطًا على 
مديريك التنفيذيين والزملاء المشغولين. ولكنك تعلم أيضًا أنه ينبغي لك أن تكون واقعيًا وموجّهًا 
بالتفاصيل» وأن تكون مشغولًا بالبيانات» لا سيما في عامم اليوم الذي يركز على المقاييس. 

إن لتقديم البيانات والحقائق eza‏ فائقةً. ولكن عندما يتم إغراق الزملاء والإدارة العليا 
بالبيانات والوقائع دون سياق؛ فذلك يُعَذُ خسارةٌ بلاشك. لقد قمنا جميعً ا بتجربة عروضٍ 
تقدهية باستخدام طبقات الشرائح الكبيرة. فقط لنكتشف أن الجمهور غارق في البيانات لدرجة 
أنهم لا يعرفون ما يفكّرون به. أو أنهم بالكامل لا يأخذون سوى جزء بسيط من النقاط الأساسية. 

ابدأ في إشراك فريقك التنفيذيء وشَّرْح إستراتيجياتك ونتائجك بقوة أكبر من خلال الاقتراب من 
مهمتك كراوي. ستحتاج إلى إجابة سؤال: «ما هي قصتك؟» (الحقائق والبيانات)؛ ولكنك ستحتاج 
أيضًا إلى أسئلة من نوع: «من؟» و«كيف؟5» و«ماذ!؟» والسؤال الذي يفتقده الجمهور غالبًا هو: 
«ثم efla‏ إنها عناصر القصة التي ستجعل بياناتك ذات صلة وملموسة لجمهورك. إن إنشاء 
قصة جيدة من شأنه مساعدة الإدارة العليا في التركيز على ما هو مهم. 


لماذا قصة؟ 


القصص تنفجٌ الروح في الحقائق والبيانات وتجعلها حيةً. كما يمكن أن تساعدك القصة على 
فهم البيانات وترتيبها من خلال مجموعة متباينة من الحقائق. فهي تجعل من السهل تذكر النقاط 
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الأماسية» ويمكن أن ترسمَ صورةً حيةً لما يمكن أن يبدو عليه المستقبل. كما تعمل القصصٌ de Ua‏ 
al‏ نوع من التفاعل؛ بحيث يضع كل واحدٍ من الجمهور نفسه في القصة. ويبدأ التعامل مع الموقف. 

b iss منذ زمن طويل السرد القصصي؛ لتمرير المعرفة والمحتوى.‎ SLEY pasia 
القصص في بعض الثقافات أمرًا حيويًا لهويتهم. فعلى سبيل المثال: في نيوزيلندا؛ يقوم بعض‎ 
شعوب الماوري بوشم وجوههم بالموكوس. والموكوس هو وشم للوجه يحتوي على قصة عن قدماء‎ 
القبائل والعائلات. قد يكون لدى الرجل تصميمٌ وشمي على وجهه يُظهر ملامح رأس مطرقة‎ 
لتسليط الضوء على الصفات الفريدة المتعلقة بتسَبه. ويُعبّر التصميمُ الذي يختاره عن جزء من‎ 
«ذاته الحقيقية» ووطن أسلافه.‎ 

وبا مشل» عندما نحاول أن نفهمَ قصةً ماء يتنقل راوي القصة لإيجاد الشمال الحقيقي True»‏ 
ط٤اN0».‏ وإذا كانت الإدارة العليا تتطلّع إلى مناقشة كيفية استجابتها في المستقبل للتغييرات 
التنافسية؛ فإن القصة الجيدة يمكن أن تكون ذات معنَّى ومُنقّاة من الكثير من الضوضاء. فعلى 
سبيل المثال: قد يكون لديك حقائق وبيانات من دراستين؛ إحداهما تتضمّن نتائج من دراسة 
إعلانية والأخرى من دراسة حول الرضا عن المنتتج. إن تطوير قصة ما قمت بقياسه في كلتا 
الدراستين يمكن أن يساعد الأشخاص على الحصول على رؤية كلية في الوقت الذي تُوجّد فيه أجزاء 
متباينة. ولجَمْع الموزّعين حول منتج جديد, يمكنك استخدامٌ قصة لإعطاء رؤية لما يمكن أن يبدو 
عليه المستقبل. والأهمُ من ذلك أن sed‏ القصصي تفاعايٌ فعادةً ما يتستخدم مُقدَّم البرامج 
كلماتٍ وصوراً يمكن لأفراد الجمهور zig‏ أنفسهم فيها. ونتيجةٌ لذلك؛ يصبحون أكثر les‏ 
بالمعلومات وأفضل فهمًا لها. 


adl (ra ls TS]‏ الجيدة؟ 


يكن لمعظم الناس بسهولة حفظ وترديدٌ نضّ فيلمهم/ كتابهم المفضل. أو يتذكرون Áa‏ 
مضحكةً شاركها أحد الزملاء مؤخرًا. لماذا يتذكر الناسٌ هذه القصص؟ لأنها تحتوي على صفاتٍ 
مميزةٌ معينة. أولا: تحتوي القصة الجيدة على شخصيات عظيمة. وقد يكون لدى القارئ أو 
المُشاهد في بعض الحالات خبرةٌ غير مباشرة عندما يصبح مشاركًا في الشخصية. والتي (أَيْ: 
الشخصية) تواجه بعد ذلك تحديًا صعبً؛ ولكنه قابلٌ للتصديق. ويجب أن تعترض طريق الشخصية 
بعض عقبات؛ ولكنها تتخطاها. وأخيرً؛ وبنهاية القصة تكون النتيجة واضحةً أو التخمين بها 
ممكن. وقد لا يتم حل الموقف - ولكن لا بذ للقصة من نقطة نهاية واضحة. 
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فكّر في تحليلك كقصة - استخدم هيكل قصة: 
عند صياغة قصة غنية بالبيانات؛ يكون الهدف الأول هو العثور على القصة. مَنْ هم الشخصيات؟ 
ما هي الدراما أو التَحَدّي؟ ما هي العقبات الواجب تخطيها؟ وفي نهاية قصتك؛ ما الذي تريد من 
جمهورك أن يفعله كنتيجة لذلك؟ وبمجرد CÍ ipeo‏ القصة, قُمْ بتركيب باقي عناصر قصتك؟ xp‏ 
حَدَّد شخصياتك. افهم التحَدَّيء وحَدّد العقبات» ثم قم ببلورة النتيجة أو سؤال القرار. تأكّد من 
أنك Le klg‏ تريد أن يفعله الناس كنتيجة لذلك. وسيّجِسَّد هذا كيفية استرجاع الجمهور لقصتك. 
ثم باستخدام عناصر القصةء قم بكتابة القصة المصوّرة» JE quil‏ هيكل وتكوين قصتك. وعلى 
الرغم من أن تخَطَي هذه الخطوة ممتعٌ للغاية؛ فإنه من الأفضل أولّا فهم القصة التي ترويهاء 
ومن ثم التركيز على بنية وشكل العرض. وبمجرد وَضْع لوحة العمل في مكانهاء ستقع بقية العناصر 
الأخرى في مكانها كذلك. وستساعدك لوحة العمل على التفكير في أفضل المجازات أو الاستعارات» 
وعلى تحديد التحَدَّي أو الفرصة بوضوح. وأخيراه ستساعدك على رؤية التدفق والتحؤلات اللازمة. 
وستساعدك لوحة العمل أيضًَا على التركيز على العناصر المرئية الأساسية (الرسوم» وا مخططات 
dol‏ والجرافكس) التي تحتاج إلى اس ترجاع بواسطة الموظفين الإداريين لديك. ويُوضّح الشكل 
4-1 قصة تأثير القروض الصغيرة من وجهة نظر عالممية داخل بيئة التحليلات المرئية ( Tableau‏ 
باختصار, لا تخف من استخدام البيانات لسَرّْد قصص عظيمة. ومن الأهمية بمكان أن تكون 
القصة واقعيةً وقائمةً على التفاصيل وموجهةً بالبيانات في العالم المرتكز على القياس في هذه الأيام؛ 
ولكن ليس بالضرورة أن تكون مملًا وطويلًا. وفي الواقع. يمكنك من خلال إيجاد القصص الحقيقية 
في بياناتك ومتابعة أفضل الممارسات, كَسُْبٍ أشخاص للتركيز على رسالتك - وبالتالي على ما هو 
مهم. وفيما يلي أفضل تلك الممارسات: 
-١‏ فكّر في تحليلك كقصة, استخدم هيكل قصة. 
us $$ -*‏ فكّر في نفسك كمؤلف أفلام. 
ع- اجعل الأمرّ سهلًا على جمهورك وعلى نفسك. 
425-0 دعوة, واجرٍ مناقشةً مباشرة. 
Source: Fink, E., & Moore, S. J. (2012). Five best practices for telling great stories with data. White paper‏ 
by Tableau Software, Inc., www.tableau.com/whitepapers/telling-data-stories (accessed May 2016).‏ 
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i‏ قروض صغيرة: أثر كبير 
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شكل 6-17!: تصوير مرني لقصة في Tableau gaby‏ 

بيئات تحليلات بصرية عالية القوة: 

نظرًا للطلب المتزايد على التحليلات المرئية المقترنة بأحجام البيانات السريعة النمو؛ فهناك 
تحرّك حثيث باتجاه الاستثمار في أنظمة تصوير البيانات ذات الكفاءة العالية. ومع تحرّكاتهم 
الأخيرة في مجال التحليلات المرئية؛ أصبح معهد 545 العملاق للبرمجيات الإحصائية الآن من بين 
أولئك الذين يقودون هذه الموجة؛ إذ يُكَذَّ منتجهم الجديد. تحليلات585 المرئية حوس بةٌ عالية 
الأداءء وخَلاً مختزناً في الذاكرة؛ لاستكشاف كميات هائلة من البيانات في وقت قصير للغاية (فوري 
تقريبً/. فهي تكن المستخدمين من تحديد الأماطء وتسليط الضوء على الفرص المؤهلة لزيد من 
التحليلء ونقل نتائج مرئية عبر تقارير الويب أو منصة متحركة» مثل: الأجهزة اللوحية والهواتف 
الذكية. ويُوضُح الشكل ۲٠-۲‏ البنية العالية المستوى لمنصة تحليلات 545 المرئية. ويُوجَد على 
أحد طرفي الهندسة المعمارية» قدرةٌ عالليةٌ على إنشاء البيانات وإمكانيات المسؤول؛ مما يؤدي إلى 
مُستكشفء ومُصمّم تقارير ووحدات ذكاء الأعمال محمولة قيّمة جدًَا؛ مما يوفر بشكلٍ جماعي 
حلاً تحليلياً مرئياً من البداية إلى النهاية. 
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شكل ؟-90: نظرة عامة على بنية تحليلات 545 الطرئية 
وفيما يلي بعص المزايا الرئيسة المقترحة بواسطة تحليلات 545 اطرئية: 


- تكن جميع المستخدمين من استخدام تقنيات استكشاف البيانات والتحليلات سهلة الإجراء؛ من 
أجل تحسين عملية صَنْع القرار. كما ثمُكّن تحليلات 5945 المرئية أنواعًا مختلفةً من المستخدمين 
من إجراء عمليات استكشاف سريعة وشاملة لجميع البيانات اممتاحة. Léa Yo‏ أخذ عينات 


لتقليل حجم البيانات. 


- تعمل واجهات الويب التفاعلية سهلة الاستخدام على توسيع جمهور التحليلات» وتمكينه من 
تحصيل رؤى جديدة. كما يمكن للمستخدمين الاطلاع على مزيد من الخيارات» واتخاذ قرارات 


أكثر دقةء والوصول للنجاح بشكلٍ أسرع من ذي قبل. 


- نُسهل الإجابة عن الأسئلة المعقدة بشكل أسرع, وتعزيز مساهمات موهبتك التحليلية؛ إذ 
تدعم تقنية تحليلات 845 المرئية عملية اكتشاف البيانات واستكشافها من خلال توفير نتائج 
فائقة السرعة؛ لتمكين إجراء تحليل أفضل وأكثر تركيرًً. ويمكن للمستخدمين المحنّكين تحليليًا 
تحديدٌُ مجالات الفرص أو التهديدات المتعلقة بالكميات الكبيرة من البيانات؛ بحيث يمكن 


تحقيق مزيدٍ من التحليلات بسرعة. 


- نُحسّن مشاركة المعلومات والتعاون. فيُمكن لأعداد كبيرة من المستخدمينء بما في ذلك ذوو 
المهارات التحليلية المحدودة؛ عَرْضُ التقارير والرسوم البيانية والتفاعل معها بسرعة عبر الويب 
PDF cl alas‏ 40056 وأجهزة 1024 المحمولة؛ في حين تحافظ تقنية المعلومات على التحكّم 
في البيانات الأساسية والأمان. وبذلك توفر تحليلات 545 المرئية المعلومات المناسبة للشخص 


ysa 


ا مناسب وف الوقت المناسب لتحسين الإنتاجية والمعرفة التنظيمية. 
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- تُحرّر تقنية المعلومات من خلال مَنْح المستخدمين طريقة جديدة؟؛ للوصول إلى ا معلومات التي 
يحتاجون إليها. وأيضًا تحرير تقنية المعلومات من وابل المطالب المستمر من ال مس تخدمين 
الذين يحتاجون إلى الوصول إلى كمياتٍ مختلفة من البيانات. ووجهات نظر مختلفة للبياناتء 


مُعدَّة لغرض معينء وطلبات المرة الواحدة للحصول على المعلومات. 


وتقارير 


- تمَكّن تقنية المعلومات من تنزيل البيانات وإعدادها بسهولة لعدَّة مستخدمين. فبمجرد 
تنزيل البيانات وجَعْلها متاحةً؛ يمكن للمستخدمين استكشاف البيانات بحيوية وإنشاء التقارير 
ومشاركة المعلومات ممفردهم. 

- تُوفْر مساحةٌ للنمؤٌ بوتيرة مُحدّدة ذاتيًا. كما توفر تحليلات 545 المرئية خيار استخدام أجهزة 
قاعدة البيانات للسلع المُقدّمة من EMC Greenplum‏ وتيراداتا. وقد تمّ تصميمه من الألف 


لتحسين الأداء وقابلية التوسّع لتلبية احتياجات أيّ منظمة بأيّ حجم. 


إلى الياء؛ 


ويعرض الشكل 77-7 لقطة شاشة لمنصة تحليلات 545 المرئية؛ إذ يتم تصوير التنبؤ بالسلاسل 
الزمنية وفاصل من الثقة حول التوقعات. 
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شكل 9-”7: لقطة شاشة من تحليلات 545 اللرئية 
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أسئلة مراجعة على القسم :٠١-7‏ 

-١‏ ما الأسبابٌ الرئيسة وراء النشأة الحديثة للتحليلات المرئية؟ 

۲- انظر إلى 01120381 عأع313 لمنضَّات ذكاء الأعمال والتحليلات. ماذا ترى؟ ناقش وعلل ملاحظاتك. 
*- ما القرق بين تصوير المعلومات والتحليلات المرئية؟ 

؟- لماذا يجب أن يكون سرد القصص جزءً! من إعدادك للتقارير وتصويرك للبيانات؟ 

-٥‏ ما هي بيئة التحليلات المرئية عالية الأداء؟ ولماذا نحتاجها؟ 


١-٣۲‏ لوحات المعلومات: 

تعن لوحات المعلومات من المكوّنات الشائعة لمعظم منصات ذكاء الأعمال أو تحليلات الأعمال» 
إن م يكن لها جميعًاء وكذلك أنظمة إدارة أداء الأعمالء ومجموعة برامج قياس الأداء. توفّر لوحات 
المعلومات عروضاً مرئيةٌ لمعلومات مهمة يتم توحيدها وترتيبها على شاشة واحدة؛ بحيث يمكن 
استيعابٌ تلك المعلومات في لمحة واحدة وفحصها بسهولة واستكشافها بشكل أكبر. تظهر لوحة 
التحكم النموذجية في الشكل ۲۷-۲. وتعرض لوحة ا معلومات التنفيذية هذه مجموعةٌ متنوعةٌ من 
مؤشرات الأداء الرئيسة (1215) لشركة برمجيات افتراضية تُسمّى 5088018 (لبيع الأدوات الصوتية). 
eX LS‏ تلك اللوحة عرضًا عالي المستوى للمجموعات الوظيفية المختلفة المحيطة بالمنتجات؛ بددًا 
من نظرة عامة إلى جهود التسويق والمبيعات والتمويل وإدارات الدعم. ويهدف كل هذا إلى إعطاء 
صانعي القرار التنفيذيين فكرةً سريعةً ودقيقةً عمًا يجري داخل المنظمة. على الجانب الأيسر من 
لوحة المعلومات؛ يمكننا أن نرى (بطريقة السلاسل الزمنية) التغييرات ربع السنوية في الإيرادات 
والنفقات وهوامش الربح, وكذلك مقارنة هذه الأرقام بالأرقام الشهرية للسنوات السابقة. في الجانب 
العلوي الأمن؛ نرى وجهين مع مناطق مشفرة بالألوان يعرضان مقدار النفقات الشهرية لخدمات 
الدعم (الاتصال الهاتفي على اليسار) ومقدار النفقات الأخرى (الاتصال الهاتفي على اليمين). كما 
يشير الترميز اللونيء وعلى الرَغم من أن نفقات الدعم الشهرية تقع ضمن النطاقات العادية؛ فإن 
النفقات الأخرى تقع في ا منطقة الحمراء؛ مما يشير إلى القيم المفرطة. وتوضّح الخريطة الجغرافية 
في أسفل اليمين توزيع المبيعات على مستوى البلد في جميع أنحاء العالم. تُوجَّد خلف هذه الرموز 
الرسومية مجموعةٌ متنوعةٌ من الوظائف الرياضية التي تجمع العديد من نقاط البيانات إلى أعلى 
مستوياتها من الأرقام ذات المعنى. من خلال النقر على هذه الرموز الرسومية» يمكن لمستخدمي 
هذه المعلومات الانتقال إلى مستويات أكثر دقة من المعلومات والبيانات. 
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شکل ۲۷-۲: عينة لوحة معلومات تنفيذية 
يتم استخدامٌ لوحات المعلومات في مجموعة متنوعة من الأنشطة التجارية المجموعة متنوعة 
من الأسباب. فعلى سبيل المثال: في الحالة العملية ۷-۲ ستجد ملخص التنفيذ الناجح ملعلومات 
لوحات ال معلومات من قبل فريق دالاس كاوبويز لكرة القدم. 
حالة عملية ۷-٣‏ 

فریق دالاس کاوبویز يحقق نتائج كبيرة مع تابلوه (Teknion) 5555s (Tableau)‏ 

تأسّس دالاس كاوبويز في عام 1970م: وهو فريق كرة قدم أميري محترف ومقره 

في إيرفينغء تكساس. ويتبع الفريق عددٌ كبيرٌ من الأندية الوطنية» والتي رها تكون 

صاحبة أفضل تمثيل بسجل اتحاد كرة القدم الأميري لعدد المباريات المتتالية في الملاعب 


التي تمّ بيعها بالكامل. 
ngiso‏ 


كان بيل برياكوس - الرئيس التنفيذي للعمليات في القسم التجاري بفريق دالاس 
كاوبويز - وفريقه بحاجة إلى رؤية أكثر وضوحًا في بياناتهم؛ حتى يتمكنوا من تشغيلها 
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۳ 


بشكل أكثر ربحية. فتمّ اختيارٌ مايكروس وفت كمنصة أساسية لهذه الترقية بجانب 
عددٍ آخر من تطبيقات المبيعات والخدمات اللوجستية والتجارة الإلكترونية (لكلّ 
ميجاوات). وتوفّع كاوبويز أن بنية المعلومات الجديدة هذه سوف توفر التحليلات 
والتقارير اللازمة. ولكن لسوء الحظ م يحدث هذاء ومن ثم بدأ البحث عن أداة قوية 
للتحكّم في المعلومات والتحليلات وإعداد التقارير لسَدَّ هذه الفجوة. 

الحل والنتائج: 

قام js‏ من ننهعاطة]" وذنمتمعاء]' بتوفير إمكانيات إعداد تقارير لوحة ال معلومات 
الفورية» والتي تجاوزت متطلبات كاوبويز. وبشكل مُنظّم وممنهج. عمل فريق 
ekin‏ جنبًا إلى جنب مع مالكي ومستخدمي البيانات داخل دالاس كاوبويز لتقديم 
كل الوظائف المطلوبة: في الوقت المحَدّد وفي حدود الميزانية المرصودة. وقال بيل 
لويزي - نائب الرئيس في «منهاء1: «في وقتٍ مبكر من هذه العملية؛ كنا قادرين 
على الحصول على فهم واضح لا قد يتطلبه الأمر لتشغيل عملية أكثر ربحيةٌ بالنسبة 
لكاوبويزء وتُعَنُ هذه الخطوة من العملية خطوةٌ رئيسةً في «dans i$] ga Teknion ej‏ 
ودائمًا ما يقوم بتوزيع أرباح هائلة كلما أحرزت خطة التنفيذ تقدمًا». وأضاف لويزي: 
«بكلٌ تأكيد؛ e Tableau Jas så)‏ كَتّبِ معنا ومع كاوبويز خلال المشروع بأكمله. 
وقد حرصنا معًّا على التأكد من أن كاوبويز يمكنهم تحقيق أهدافهم في إعداد التقارير 
والتحليل في زمن قياسي». 

والآن؛ ولأول مرة يستطيع فريق دالاس كاوبويز مراقبة أنشطته التجارية بالكامل 
بدءً! من التصنيع ووصولًا إلى العميل النهائيء وليس فقط رؤية ما يحدث عبر دورة حياة 
النشاط؛ بل التعمّق أكثر في سبب حدوثها. poslo‏ يتم استخدام حل ذكاء الأعمال؛ 
لإعداد تقرير عن أنشطة الأعمال للقسم التجاري وتحليلهاء والذي يُعَد ا مسؤول عن 
جميع مبيعات العلامة التجارية في دالاس كاوبويز. وتشير تقديرات الصناعة إلى أن 
مبیعات کاوبویز تش كل ۲١‏ من جميع مبيعات البضائع في اتحاد كرة القدم الأمريي؛ 
مما يعكس حقيقة أن كاوبويز هو صاحب أكثر حقوق الامتياز الرياضية شهرةً في العالم. 

وفقًا Os$o 125 :ComputerWorld 354 |) Lula «99 db jy‏ 3 )955 وبقية 
فريق دالاس كاوبويز متواضعي المستوى فقط في مجال كرة القدم في السنوات القليلة 
الماضية» ولكن بعيدًا عن الملعب. وخاصةً في ميدان التجارة؛ فإنهم يظلون فريقاً أمريكيًا. 
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أسئلة للمناقشة: 
-١‏ كيف استخدم دالاس كاوبويز تصوير المعلومات؟ 


ls -Y‏ هو التَحَذَّي والحل المقترح والنتائج المتحضّل عليها؟ 
Sources: Lai, E. (2009, October 8). BI visualization tool helps Dallas Cowboys sell‏ 
more Tony Romo jerseys. Computer World; Tableau case study. tableausoftware.com/‏ 


learn/stories/tableau-andteknion-exceed-cowboys-requirements (accessed July 2016). 


تصميم لوحة المعلومات: 

لا تُّمَدُ لوحات المعلومات مفهومًا جديدًا. فيمكن أن تعود جذورها التاريخية على 
الأقل إلى نظام المعلومات التنفيذية في ثمانينيات القرن العشرين. واليوم. تتواجد لوحات 
ا معلومات في js‏ مكان. فعلى سبيل المثال: قبل عدة سنوات. قذَّرت Forrester Research‏ 
أن أكثر من 6١٠‏ من أكبر ٠٠٠١‏ شركة في العام استخدمت هذه التقنية (أنتي آند 
مكجريجور .)۲١١١‏ ومنذ ذلك الحين؛ يمكننا أن نعتبر بمنتهى الثقة أن هذا الرقم 
قد ارتفع بشكلٍ كبير. وفي الواقع؛ في هذه الأيام سيكون من غير المعتاد رؤية شركة كبيرة 
تستخدم نظامًا لذكاء الأعمال لا يعتمد على لوحات التحكم في الأداء. كما يُقَدَّم موقع 
XLJs Dashboard Spy (dashboardspy.com/about)‏ آخر على وجودها في كلّ مكان. 
ويحتوي الموقع على أوصاف ولقطات شاشة لآلاف من لوحات المعلومات ذكاء الأعمال» وبطاقات 
النتائج وواجهات ذكاء الأعمال المُستَخدّمة من قبل الشركات من جميع الأحجام والصناعات» 
والمنظمات غير الرّبحية, والوكالات الحكومية. 

وفقاً ل (2006) 5)۲0 وهو خير معروف في ذكاء الأعمال بشكلٍ عام ولوحات المعلومات على 
وجه الخصوص؛ فإن الخاصية الأكثر ترا في لوحة المعلومات هي ممتعها بثلاث طبقات من المعلومات: 
-١‏ المراقبة: البيانات الرسومية المُستَخرّجة لرَصْد مقاييس الأداء الرئيسية. 
؟- التحليل: تلخيص البيانات ذات الأبعاد لتحليل السبب الجذري للمشكلات. 
“- الإدارة: تفصيل البيانات التشغيلية التي تِحَدَّد الإجراءات التي يجب اتخاذها لحل مشكلة ما. 

بسبب هذه الطبقات؟ فإن توحات ال معلومات تحوي الكثير من المعلومات في شاشة واحدة. 
ووفقاً ل (2005) Few‏ «يتمثل التحَدَّي الأماسي لتصميم لوحة المعلومات في عرض جميع المعلومات 
المطلوبة على شاشة واحدة بوضوح وبدون تشتيت» بطريقة يمكن استيعابها بسرعة». ولسرعة 
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استيعاب الأرقام؛ يلزم وَضْع الأرقام في السياق. ويمكن القيام بذلك عن طريق مقارنة الأرقام محل 
الاهتمام بالأرقام الأخرى الأساسية أو المُستَهدّفة؛ وذلك بالإشارة إلى ما إذا كانت الأرقام جيدةً أم 
سيئة. عن طريق معرفة ما إذا كان الاتجاه أفضل أم أسوأء وباستخدام أدوات أو عناصر عرض 
متخصصة لوضع السياق النسبي والتقديري. وتشتمل بعض المقارنات الشائعة التي يتم إجراؤها 
عادةً في أنظمة ذكاء الأعمال على مقارنات مع القيم السابقة والمتوقعة وامُستهدّفة والقياسية أو 
القيم المتوسطة والمتعددة لنفس القياسء وقيّم المقاييس الأخرى (مثل: الإيرادات مقابل التكاليف). 
وحتى مع القياسات النسبية» من امهم أن نشير على وجه التحديد ما إذا كان رقمٌ معينٌُ جيدًا آم 
سيئًا وما إذا كان متجهًا في الاتجاه الصحيح أم لا. وبدون هذه الأنواع من الدّلالات التقييمية, قد 
يستغرق الأمرُ وقنًا طويلًا لتحديد حالة رقم ما أو نتيجة معينة. وعادةٌ؛ يتم استخدامٌ OLSE GÍ‏ 
مرئية متخصصة (مثل: إشارات المرور, والمفاتيح: وا معايي) أو السّمات المرئية (مثل: ترميز الألوان) 
لتعيين السياق التقديري. ويبرز ف الحالة العملية ۸-۲ حل تفاعلنٌ لاستكشاف بيانات التقاري 
يقوم هذا الحلّ على لوحة المعلومات, وقد تم بناؤه بواسطة شركة طاقة. 


حالة عملية A-Y‏ 
تساعد التحليلات المرئية مورد الطاقة في عمل روابط أفضل 

تشهدٌ أسواق الطاقة في جميع أنحاء العالم تغيرًا وتحؤلًا كبيرين؛ مما يصنع فرضًا 
كبيرةٌ إلى جانب تحَدّيات كبيرة. وكما هو الحال ف أي صناعة»ء تجتذب الفرصٌ عددًا 
أكبر من اللاعبين في السوق؛ مما يزيد المنافسة:. ويُقلّل من مستوى التفاوت في اتخاذ 
القرارات التجارية بشكلٍ أقل من المثالية. ويتطلّب النجاح إنشاء ونشر معلومات 
دقيقة وفي الوقت المناسب وتقدهها إلى أي شخص. وكلما دعت الحاجة. فعلى سبيل 
المثال: إذا aS‏ بحاجة إلى تتيّع كلّ من ميزانيات التسويق بسهولة. والتوازن بين أحمال 
عمل الموظفين» واستهداف JI‏ العملاء برسائل تسويقية مُخصّصة؛ فستحتاج إلى ثلاثة حلول 
مختلفة لإعداد التقارير. تقوم شركة :5]782 61217 JS Electrabel‏ ذلك؛ من أجل 
وحدة أعمال التسويق وا مبيعات الخاصة بها مع مِنضّة تحليلات 545 المرئية. 

إن نهج الحلّ الواحد هو توفيرٌ كبيدٌ للوقت لمحترفي التسويق في صناعة تشهدُ تغيراً 
هائلاً. يقول داني نوب -مدير إعداد التقارير والتطوير في وحدة أعمال التسويق والمبيعات 
في #طدماء»51: «إنه تَحَدٌ كبير لاستقرار مركزنا السُوقي في سوق الطاقة. Jens‏ ذلك 
الحجمّ والأسعارٌ وهوامسٌ الرّبح Sd‏ من عملاء التجزئة والأعمال التجارية». olus Axis‏ 
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الشركة أكبة مور للكهرباء في بلجيكا وأكبر منت ج للكهرباء قي كل من بلجيكا وهولندا. 
يقول نوب: «إنه من الأهمية بمكان أن تزيد اءطهماء116 من كفاءة اتصالات عملائها؛ 
إذ إنها تستكشف القنوات الرقمية الجديدة وتطوّر خدمات جديدة متعلقة بالطاقة». 

ويضيف نوب: «كلما عرفنا العملاء بشكل أفضل؛ كان احتمالٌ نجاحنا aS]‏ وهذا 
هو السببٌُ في أننا نجمع المعلومات من مصادر متنوعةء مثل: حركة الهاتف مع العميل 
والأسئلة عبر الإنترنت, والرسائل النصيةء وحملات البريد. وستّشكل هذه المعرفة امعرزة 
لعملائنا وقاعدة العملاء المحتملين مَيْرْةً إضافيةٌ في سوقنا التنافسية». 

نسخة واحدة من الحقيقة: 


Electrabel CoS‏ تستخدم منصات وأدوات متنوعةً لأغراض إعداد التقارير. وقد 
uel‏ ذلك أحيانًا إلى غموض ق الأرقام المذكورة. وقد واجهت المؤسسة أيضًا مشكلاتٍ في 
الأداء في معالجة وحدات مستودعات البيانات الكبيرة. تزيل تحليلات 585 المرئية مع 
تقنية الذاكرة الغموض ومشكلات الأداء. يقول نوب: «لدينا الاستقلالية والمرونة للاستجابة 
للحاجة إلى رؤية العملاء وتصوير البيانات داخليًا. وبعد كلّ هذا يُعَدُ الإعدادُ السريع 
للتقارير أحد المتطلبات الأساسية للإدارات الموجّهة عمليًا مثل المبيعات والتسويق». 

العمل بشكل أكثر كفاءة وبتكلفة أقل: 

تسعى تحليلاتٌ 5845 الطرئية إلى تشغيل عملية تحديث المعلومات في التقارير 
بصورة آلية. فبدلًا من إنشاء تقرير قديم في وقت اكتماله؛ يتم تحديث البيانات لجميع 
التقارير مرةً واحدةً في الأسبوع وإتاحتها على لوحات المعلومات. وفي نشر الحل» 
g Electrabel cyk‏ تدريجِيًا يبدأ بتقارير بسيطة وينتقل إلى تقارير أكار تعقيدًا. 
وقد احتاج التقريرٌ الأول بضعة أسابيع لبنائه» ثم جاءت بقية التقارير بشكل أسرع. 
وتتضمّن النجاحات ما يلي: 

- تستغرق البياناثُ التي استغرقت يومين للتحضير الآن ساعتين فقط. 

- مسح رؤية بيانية لفواتير وتكوين الفواتير للعملاء 828. 


- تقرير إدارة عبء العمل من قبل الفرق التشغيلية. مما يمكّن المديرين من تقييم أعباء 


فريق العمل على أساس أسبوعي أو طويل الأجل وهكنهم من إجراء تعديلات وفقًا لذلك. 


يقول نوب: «لقد قمنا بتحسين كفاءة أعمالنا بشكلٍ كبي. ويمكننا تقديمٌ بيانات 
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عالية الجودة. وتقارير بشكلٍ أكثر تكرارًا وبتكلفة أقلّ بكثير. وإذا كانت الشركة بحاجة 
إلى تجميع البيانات من مصادر متعددة؛ فهذا أيضًا من السهولة بمكان. كما يمكن إنشاءٌ 
تقارير مرثيةء استنادًا إلى هذه البيانات» خلال بضعة أيام» أو حتى بضع ساعات». 


ويضيف: «إنَّ الشركة تُخطّط لمواصلة توسيع رؤيتها في السلوك الرقمي لعملائها. 
والجمع بين البيانات من تحليلات الويب والبريد الإلكتروني والوسائل الإعلامية للتواصل 
الاجتماعي مع البيانات من أنظمة النهاية الخلفية. وفي النهاية؛ نحن نريدٌُ استبدال 
جميع التقارير التي تحتاج إلى عمل مكثف بتحليلات 545 المرثية». وكما يقول نوب 
مضيقًا: إن مرونة تحليلات 5885 المرئية أمرٌ بالغ الأهمية لإدارته: «وهذا سيتيح لنا 
امزيد من الوقت للتصَّدَّي للتحَدّيات الأخرى. ونريد أيضًا أن نجعل هذه الأداة متاحة 
على أجهزتنا المحمولة. وسيس مح ذلك لمديري الحسابات لدينا باستخدام التقارير 
الحديثة والثاقبة والقابلة للتكيّف عند زيارة العملاء. كما يوجد لدينا منضّة لإعداد 
التقارير الموجهة نحو المستقبل للقيام بكلّ ما نحتاجه». 

أسئلة للمناقشة: 


IU -Y‏ تعتقدٌ أن شركات إمدادات الطاقة من بين اللمستخدمين الرئيسيين لأدوات 
تصوير المعلومات؟ 

-٠‏ كيف استخدم 8160118061 تصوير المعلومات للنسخة الواحدة من الحقيقة؟ 

e ما التحديات التي واجهوها؟ وماذا كان الحل اممقترح؟ وما النتائج التي‎ -۴ 
الحصولٌ عليها؟‎ 
Source: SAS Customer Story, "Visual analytics helps energy supplier make 
better connections" at http://www.sas.com/en us/cus-tomers/electrabel-be. 


html (accessed July 2016). Copyright 6 2016 SAS Institute Inc., Cary, NC, 
USA. Reprinted with permission. All rights reserved. 


ما الذي تبحث عنه في لوحة المعلومات: 


على الرغم من اختلاف أداء لوحات المعلومات والأَطْر الأخرى لتصوير ال معلومات؛ فإنها 
جميعها تشتركٌ في بعض الخصائص الشائعة للتصاميم. أولًا: إنها جميعًا ملائمة لنظام ذكاء 
الأعمال الأكبر أو نظام قياس الأداء. وهذا يعني أنَّ البنية الأساسية الخاصة بهم جميعًا هي ذكاء 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري yev‏ 


الفصل الثاني 


الأعمال أو بنية إدارة الأداء في النظام الأكبر. ثانيّاه تتميّع كلّ لوحات المعلومات المُصمّمة جيدًا 

وتصويرات ال معلومات الأخرى بالخصائص التالية (2009 ,لا2107): 

- جميعها تستخدم مكوّنات بصرية (مثل: الرسومات البيانية» وأشرطة الأداء. وخطوط المؤشرات» 
والمقايبس» والأمتارء وإشارات المرور الضوئية)؛ لتسليط الضوء - في لممحة واحدة - على البيانات 
والاستثناءات التي تتطلّب اتخاذ إجراء. 

AS -‏ جميعها شفافةٌ للمستخدم: وهذا يعني أنها تتطلّب الحَدّ الأدنى من التدريب وتكون سهلة 
الاستخدام للغاية. 

- جميعها تجمّع البيانات من مجموعة متنوعة من الأنظمة إلى عَرْضٍ واحدٍ وموجز ومُوحّدِ للأعمال. 

- إنها جميعًا تمكّن من التمحيص أو الانتقال إلى مصادر البيانات الأساسية أو التقارير؛ مما يوفر 
مزيداً من التفاصيل حول السياق الأساسي النُسبي والتقديري. 

på -‏ جميعها عرضًا حيويًا للعالم الحقيقي مع تحديث البيانات في الوقت المناسب؛ مما يتبح 
للمُستخدم النهائي مواكبة أحدث التغييرات في النشاط التجاري. 

- تتطلّب جميعها القليل من الترميز المُخصّص - إن وجد - لتنفيذه ونشره وصيانته. 


أفضل الممارسات في تصميم لوحة المعلومات: 

إن ترديد العقارات يلقولة «الموقع الموقع, الموقع» تُظهر بوضوح أن السّمة الأكثر أهميةٌ لجزء 
من الملكية العقارية هي المكان الذي تُوجَد فيه. أمّا بالنسبة إلى لوحات المعلومات فالترديدُ يكون 
«البيانات» البيانات, البيانات». فغالبًا ما تكون البيانات؛ هي أحد أهم الأشياء التي يجبٌ أخذها في 
الاعتبار عند تصميم لوحات المعلومات (2007 ,ماتاهع]0210)). حتى إذا كان مظهرٌ لوحة القيادة 
يبدو احترافيًاه وممتعاً من الناحية الجمالية ويتضمّن رسومًا بيانية وجداول تم إنشاؤها وفقًا معايير 
التصميم المرثي المقبولة؛ فمن المهمٌ أيضًا أن تسأل عن البيانات: هل هي موثوقة؟ هل هي في 
الوقت المناسب؟ هل هناك أي بيانات مفقودة؟ هل هي ثابتةٌ عبر جميع لوحات المعلومات؟ فيما 
يلي بعضُ من أفضل الممارسات القائمة على الخبرة في تصميم لوحة المعلومات (2008 ,8ط820). 


مؤشرات الأداء الرئيسية مع معايير الصناعة: 


يرغب العديدٌ من العملاء في وقتٍ ما في معرفة ما إذا كانت المقاييس التي يقيسونها هي 
المقاييس الصحيحة التي يجبٌ مراقبتها. وفي بعض الأحيان؛ يكتشف العملاءٌ أن المقاييس التي 
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يتتبعونها ليست هي المقاييس اللازم تتبّعها. إن إجراء تقييم للثغرات مع معايير الصناعة يجعلك 
تتوافق مع أفضل الممارسات في المجال. 
لف مقاييس لوحة المعلومات مع البيانات الوصفية السياقية: 
iS d‏ من الأحيان عندما يتم تقديم تقرير أو لوحة معلومات/ بطاقة نتائج مرئية لمستخدمي 
الشركات؛ es‏ هناك أسئلةٌ بدون إجابة. وفيما يلي بعض الأمثلة على ذلك: 
- ما مصدر هذه البيانات؟ 
- في أثناء تنزيل مستودع البيانات» ما النسبة امئوية للبيانات التي تم رفضها أو واجهت مشكلات 
جودة البيانات؟ 
- هل eX‏ لوحة المعلومات معلومات «جديدة» el‏ معلومات «قدهة»؟ 
- متى كانت آخر مرة تمّ فيها تحديثٌ مستودع البيانات؟ 
- ومتى سيتم تحدیثه لاحقًا؟ 
- هل كان من شأن أي صفقة عالية القيمة تحريف الاتجاهات العامة المرفوضة كجزء من عملية التنزيل؟ 


التحفّقَ من صحة تصميم لوحة المعلومات بواسطة أخصائي القابلية للاستخدام: 
في معظم بيئات لوحة المعلومات؛ يتم تصميمُ لوحة المعلومات بواسطة أخصاني أدوات 
دون الأخذ في الاعتبار بمبادئ قابلية الاستخدام. وعلى الرغم من أن مستودع البيانات يكون 
du‏ التصميم وقادراً على أن يُحقّق أداءَ جيدًا؛ إن العديدَ من مُستخدمي الأنشطة التجارية لا 
يستخدمون لوحة المعلومات؛ نظراً لعدم مواءمتها مع المستخدمين (وفقاً لاعتقادهم السائد)؛ مما 
يؤدي إلى سوء اتخاذ بنية أساسية وإلى مشكلات في إدارة التغيير. ويمكن أن يؤدي التحقق المُسبّق 
من تصميم لوحة المعلومات بواسطة أخصائي قابلية الاستخدام إلى تخفيف هذه المخاطرة. 
إعطاء أولويات وترتيب التنبيهات/ الاستثناءات المتدفقة إلى لوحة المعلومات: 
بسبب وجود أطنان من البيانات الخام؛ فمن الأهمية بمكان وجودٌ آلية لدفع الاستثناءات/ 
السلوكيات المهمة بشكلٍ استباقي إلى مستهلي المعلومات. ومن الممكن تقنينُ قاعدة الأعمال 
التي تضبط نمط التنبيه محلّ الاهتمام. كما يمكن أن يتمّ ترميزها في برنامج» باستخدام الإجراءات 
à SAI‏ في قواعد البيانات» والتي يمكنها الظهورٌ من خلال جداول الحقائق واكتشاف الأنماط 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري ۲۹ 


الفصل الثاني 


التي تحتاج إلى انتباه فوري. وبهذه الطريقة» تعثر المعلومات على مس تخدم الأعمال في مقابل 
مستخدم الأعمال الذي يتفحص جداول الحقائق لظهور الأنمماط الحرجة. 


إثراء لوحة المعلومات بتعليقات مستخدم الأعمال: 

عندما يتم تقديمٌ نفس لوحة المعلومات إلى عدة مستخدمين؛ فيمكن توفي مربع نص صغير 
يمكنه التقاط التعليقات من وجهة نظر أيِّ مُستخدم نهائي. وبهذا يمكن غالبًا وَمْعِ علامة على لوحة 
المعلومات لوضع المعلومات في سياقها؛ مع إضافة وجهة النظر إلى 1815 المهيكلة التي يتم تقدهها. 


تقديم المعلومات في ثلاثة مستويات مختلفة: 

954 تقديم المعلومات في ثلاث طبقات حسب تقسيمات المعلومات: مستوى لوحة المعلومات 
امرئيةء ومستوى التقرير الثابت» ومستوى مكعب الخدمة الذاتية. وعندما يتنقل المستخدم في لوحة 
المعلومات» هكن تقديم مجموعة بسيطة من 8 إلى ١١‏ 215]؛ مما يعكس انطباعًا حول ما يجري 
بشكلٍ جيد وما هو غير جيد. 


اختيار البنية المرئية الصحيحة باستخدام مبادئ تصميم لوحة المعلومات: 

في عَرْضِ المعلومات على لوحة المعلومات؛ يتم تقديمٌ بعض المعلومات بشكل أفضل باستخدام 
شريط الرسوم البيانيةء وبعضها يكون أفضل مع المخططات البيانية للسلاسل الزمنيةء وعند عَرْضِ 
الارتباطات» يكون مربع التبعثر هو الأفضل. وفي بعض الأحيان مجرد تقديم المعلومات كجداول 
بسيطة يكون أكثر فاعلية. وبمجرد أن يتم توثيق مبادئ تصميم لوحة المعلومات بشكلٍ صريح» 
يمكن لجميع المطوّرين الذين يعملون على الواجهة الأمامية الالتزام بنفس المبادئ في أثناء تقديم 
التقارير ولوحة المعلومات. 


توفير التحليلات الإرشادية: 

في منظمة نموذجية؛ يمكن للمستخدمين من رجال الأعمال أن يكونوا على مستويات مختلفة من 
النضج التحليلي. كما يمكن استخدامٌ إمكانية لوحة المعلومات لتوجيه مستخدم الأعمال «متوسط 
المستوى» إلى الوصول إلى نفس مسار التنقل الذي يسلكه مستخدمٌ الأعمال cÉ‏ بطريقة تحليلية. 


v‏ ذكاء الأعمال والتحليلات OBLI pleg‏ منظور إداري 


التحليلات الوصفية :)١(‏ طبيعة البيانات» النمذجة الإحصائية, تصوير البيانات 


أسئلة مراجعة على القسم :١١-۲‏ 

-١‏ ما هي لوحة المعلومات؟ وماذا هي منتشرة جداً؟ 

la -Y‏ هي عناصرٌ الرسوم البيانية المُستخدّمة عادةٌ في لوحات المعلومات؟ ولماذا؟ 
-Y‏ 551 مع الشرح الطبقات الثلاث من المعلومات المصوّرة على لوحات اممعلومات. 
6- ما هي الخصائص المشتركة للوحات المعلومات وغيرها من المعلومات المرئية؟ 
-٥‏ ما هي أفضل الممارسات في تصميم لوحة القيادة؟ 


تلخيص لأهم نقاط الفصل: 

- أصبحت البياناتٌ واحدةً من أكثر الأصول قيمةٌ لمنظمات اليوم. 

- تعد البيانات هي العنصر الرئيسي لأيّ مبادرة ذكاء أعمال, وعلم البيانات» ومبادرة تحليلات الأعمال. 

- على الرّغْم من أن القيمة المقترحة لها لا يمكن إنكارهاء وللوفاء بوعودهاء يجبُ أن تلتزم البيانات 
ببعض المقاييس الأساسية للاستخدام والجودة. 

sas -‏ البيانات (المعطاة في صورة مفردة) إلى مجموعة من الحقائق التي يتم الحصول عليها عادةٌ 
كنتيجة للتجارب أو المشاهدات أو المعاملات أو الخبرات. 

- عند أعلى مستويات الغموض؛ يكن تصنيفٌ البيانات على أنها مهيكلة وغير مهيكلة. 

- لا تكون البيانات في شكلها الأصلي/ الخام جاهزةً عادةً لتكون مفيدةً في مهام التحليلات. 

- تُعَدُ المعالجة المُسبّقة للبيانات مهمةً مُملَةَ ومتطلبةٌ للوقت؛ ولكنها ضروريةٌ في تحليلات الأعمال. 

- يُعرّف Las]‏ على أنه مجموعةٌ من التقنيات الرياضية لتوصيف وتفسير البيانات. 

- كن تصنيف الأساليب الإحصائية على أنها إِمّا وصفية أو استنتاجية. 

- تُعَدُ الإحصائيات بشكل عام والإحصائيات الوصفية بشكلٍ خاص جزءً! مهمًا من تحليلات ذكاء 
الأعمال وتحليلات الأعمال. 

- كن استخدامٌ طرق الإحصاء الوصفي لقياس النزعة ال مركزيةء أو التشتّتء أو شكل مجموعة بيانات معينة. 

- قد يكون الانحدانٌ وخاصةً الانحدار الخَطَّيِء هو أكثرُ تقنيات التحليلات شهرةٌ واستخدامًا في الإحصاءات. 

- يُنظر لكل من الانحدار الخطي والانحدار اللوجستي على أنهما النوعان الرئيسان من الانحدارات في الإحصاءات. 

- يُعرّف الانحدار اللوجستي كخوارزمية تصنيف قائمة على الاحتمالية. 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري Y‏ 


الفصل الثاني 


- ترف السلسلة الزمنية على أنها سلس لة من نقاط البيانات للمتغيرء يتم قياسها وتسجيلها في 
نقاط متتالية من الزمن متباعدة على فترات زمنية مُوحّدة. 

ds -‏ التقريرُ أيّ عملية تواصل من صُنع الإنسان تم تحضيرها بغرض معين؛ لتوصيل المعلومات 
بصيغة قابلة للتقديم أو العرض. 

- يُعَذّ تقريرُ الأعمال مستنداً مكتوباً يحتوي على معلومات تتعَلّق بأمور الأعمال. 

à] -‏ مفاتيح أيّ تقرير تجاري ناجح؛ هي: الوضوح, والإيجان والاكتمال والصحة. 

- يُعَذّ التصويرٌ المري للبيانات؛ هو استخدامٌ التمثيلات المرئية؛ لإستكشاف البيانات وفهمها وتوصيلها. 

- قد يكون المخطط البياني الأبرز للمعلومات في الماضى؛ هو ذلك الذى «Charles J. Minard 033b‏ 
والذي صوّر بيائيًا الخسائر التي تكبّدها جيش نابليون في الحملة الروسية عام 1417م 

- تتضَمَّن أنواعٌ الرسوم البيانية الأساسية الرّسم البياني الخَطّيء وشريط الرسم البياني» والرسم 
البياني الدائري. 

- غالبًا ما يتم اشتقاق الرسوم البيانية المتخصصة من المخططات الأساسية كحالات استثنائية. 

- إن تقنيات وأدوات عرض البيانات تجعل من مستخدمي تحليلات الأعمال وأنظمة ذكاء الأعمال 
أفضل مستهلكين للمعلومات. 

- تُعرّف التحليلات المرئية بأنها مزيجٌ من التصوير والتحليلات التنبؤية. 

- أذّى ازديادُ الطلب على التحليلات البصرية إلى جانب حجم البيانات سريع النمو إلى فمو هائلٍ 
في استثمارات أنظمة التصوير ذات الكفاءة العالية. 

- توفر لوحات المعلومات عروضاً مرئيةٌ لمعلومات مهمة يتم دَمْجُها وترتيبها على شاشة واحدة؛ حتى 
يمكن استيعاب تلك المعلومات في da‏ واحدة والتعمّق فيها بسهولة واستكشافها بشكلٍ أكبر. 


مصطلحات أساسية: 





التحليلات جاهزة | تصوير البيانات الانحدار الخطي أبيانات النسبة 





الوسط الحسابي |معطيات الانحدار اللوجيستي me‏ 





box-and-whiskers plot 





الإحصائيات الوصفية | متوسط الانحراف المطلق | التقرير 


box plot‏ | تخفيض الأبعاد الوسيط امريع التبعثر 
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التحليلات جاهزة تصوير البيانات الانحدار الخطي بيانات النسبة 
الرسم البياني الفقاعي sis‏ المنوال الانحراف 

تقرير الأعمال عالي الأداء بيانات اسمية الانحراف المعياري 
بيانات فئوية الحوسبة تحليلات على الإنترنت | الإحصاء 

المركزية المدرّج التكراري المعالجة (42.آ©) السّرد القصصي 
الارتباط الإحصاء الاستنتاجي | بيانات ترتيبية بيانات مهيكلة 

لوحات المعلومات الآداء الرئيسي ا مربعات الصغرى العادية | التنبق بالسلاسل الزمنية 
المعالجة المسبقة للبيانات | (OLS) (KPI) js‏ بيانات غير مهيكلة 
جودة البيانات المعرفة الرسم البياني الدائري |اختيار المتغير 

أمن البيانات التفرطح الزبيع التباين 

تصنيف البيانات elt‏ النطاق التحليلات المرئية 





أسئلة للمناقشة: 

-١‏ كيف تَصف أهمية البيانات في التحليلات؟ هل هكننا التفكيرٌ في التحليلات بدون بيانات؟ اشرح. 

-١‏ بالنظر إلى التعريف الجديد والواسع لتحليلات الأعمال؛ ما هي اط مدخلات وا مخرجات الرئيسية 
لاستمرارية التحليلات؟ 

۳- من أين تأتي بيانات تحليلات النشاط التجاري؟ وما هي مصادرٌ وطبيعة تلك البيانات الواردة؟ 

ع- ما هي المقاييس الأكثر استخدامًا في البيانات الجاهزة للتحليلات؟ 

0- ما هي الفئات الرئيسة للبيانات؟ وما هي أنواعٌ البيانات التي يمكن استخدامها في ذكاء الأعمال والتحليلات؟ 

Blas ud Sd da -1‏ نفس تمثيل البيانات لجميع نماذج التحليلات (بمعنى: هل تتطلّب نماذج 
التحليلات المختلفة مخططًا مختلقًا لتمثيل البيانات)؟ وماذا؟ sl‏ اذا لاء 

۷ اذا لا تكون البيانات الأصلية/ الأوّلية قابلةَ للاستخدام بسهولة بواسطة مهام التحليلات؟ 

8- ما هي الخطوات الرئيسة لمعالجة البيانات؟ اذكر مع الشرح أهميتها في التحليلات. 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري vr‏ 


الفصل الثاني 
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-٩‏ ماذا يعني تنظيف/ فرك البيانات؟ وما هي الأنشطة التي يتم أداؤها في هذه المرحلة؟ 

-٠‏ تمكن تطبيق تخفيض البيانات على الصفوف (أخذ العينات) و/ أو الأعمدة (اختيار متغير). 
أيُّهما أكثر تحديًا؟ اشرح. 

-١‏ ما هي العلاقة بين الإحصائيات وتحليلات الأعمال (مع الأخذ في الاعتبار مكانة الإحصاءات 
من تصنيف تحليل الأعمال)؟ 

۲- ما هي الاختلافات الرئيسة بين الإحصاء الوصفي والاستقرائي؟ 

a box-and-whiskers plot s ls -Y*‏ وما هي أنواع المعلومات الإحصائية التي تمثلها؟ 

-٤‏ ما هي خصائصٌ الشكل الأكثر شيوعًا لوصف توزيع البيانات؟ 

- اذكر مقاييس النّزعة المركزية للإحصاءات الوصفية» مع تعريف موجز لكلّ مقياس. 

- ما هي أوجه الشبه والاختلاف بين الانحدار والارتباط؟ 

۷- اذكر مع الشرح الخطوات الرئيسة لمتابعة التطور في نموذج الانحدار الخطي. 

۸- ما هي أكثر الافتراضات الواضحة شيوعًا للانحدار الخطي؟ وما الذي يلزم لنماذج الانحدار 
في مقابل هذه الافتراضات؟ 

5- ما هي أوجه الشبه والاختلاف بين الانحدار الخطي والانحدار اللوجستي؟ 

-٠٠‏ ما هي السّلاسل الزمنية؟ وما هي تقنيات التنبؤ الرئيسية لبيانات السلاسل الزمنية؟ 

la -Y‏ هو تقريرٌ العمل؟ ولماذا يتم الاحتياجُ إليه؟ 

۲- ما هي أفضل ال ممارسات في إعداد تقارير الأعمال؟ وكيف هكننا جَعْل تقاريرنا تتميّز عن غيرها؟ 

۳- اشرح عملية دورة الإدارة مع التعليق على دور تقارير الأعمال. 

-٤‏ اذكر مع الشرح الفئات الرئيسية الثلاثة لتقارير الأعمال. 

-٥‏ اذا أصبح تصويرٌ المعلومات محوريًا في تحليلات ذكاء الأعمال وتحليلات الأعمال؟ وهل 
هناك فرق بين تصوير المعلومات والتحليلات المرئية؟ 

-١‏ ما هي الأنواع الرئيسة من الرسوم/ المخططات البيانية؟ ولاذا يوجد الكثير منها؟ 

۷- كيف يمكنك تحديدٌ الرسم البياني المناسب لكلّ مهمة؟ اشرح وبَرّر إجابتك. 

8- ما هو الفرق بين تصوير المعلومات والتحليلات المرئية؟ 

۹- اذا يجب أن يكون السرد القصصي حِزءًا من إعدادك للتقارير وتصويرك للبيانات؟ 


ye‏ ذكاء الأعمال والتحليلات وعلم البيانات. منظور إداري 


التحليلات الوصفية :)١(‏ طبيعة البيانات» النمذجة الإحصائيةء تصوير البيانات 


ما هي لوحات المعلومات؟ وماذ! تعرض؟ 

"IE‏ أفضل الممارسات في تصميم لوحات المعلومات الغنية بالمعلومات؟ 

۲- هل تعتقدٌ أن لوحات المعلومات/ الأداء موجودة لتبقى؟ أم هي على وشك التقادم؟ وبرأيك 
ماذا ستكون الموجة الكبيرة التالية في ذكاء الأعمال وتحليلات الأععمال؛ من حيث تصوير 
البيانات/ المعلومات؟ 

تمارين 
جامعة تيراداتا وغيرها من التمارين اليدوية الأخرى 

-١‏ قم بتنزيل بيانات «سلوك التصويت» ووصف البيانات المختصر من موقع الكتاب على الإنترنت. 
هذه مجموعة بيانات تمّ تجميعها يدويًا من المقاطعات في جميع أنحاء الولايات المتحدة. 
تتم معالجة البيانات جزئيه أيْ: يتم إنشاء بعض المتغيرات المشتقة. وتتمثل مهمتك في إجراء 
معالجة مسبقة للبيانات من خلال تحديد الخطأ والشذوذ. واقتراح الإصلاحات والحلول. وفي 
النهاية؛ يجب أن يكون لديك إصدارٌ جاهرٌ للتحليلات لهذه البيانات. ومجرد اكتمال المعالجة 
المسبقة. اسحب هذه البيانات إلى ناه18616 (أو إلى أداة برمجية أخرى لتصوير البيانات)؛ 
لاستخراج معلومات مرئية مفيدة منها. وللقيام بذلك؛ قم بِوَضْع الأسئلة والفرضيات ذات 
الضّلة (ابتكر ثلاثةٌ منها على الأقل). وقم بإنشاء تصويرات ملائمة تتعامل مع تلك الأسئلة ل 
«اختبارات» تلك الفرضيات. 

ġa) Tableau Jajo eô -Y‏ على 22م60.لنه80[1]ء باتباع الإرشادات الأكاديمية لتنزيل البرامج 
المجانية من على موقعها). Visualization MFG Sample c»5LJl áe gaza ela Lob‏ 
(المتاحة على ملف 861 على موقع هذا الكتاب). أجب عن الأسئلة التالية: 
-١‏ ما هي العلاقة بين إجمالي إيرادات شباك التذاكر والمعلمات الأخرى المتعلّقة بالفيلم 

الواردة في مجموعة البيانات؟ 
"- كيف تختلف هذه العلاقة عبر سنوات مختلفة؟ إعداد تقرير مكتوب ذي مظهر احترافي 
يتم تحسينه باستخدام لقطات من نتائجك الرسومية. 

.teradatauniversitynetwork.com J) Jsl -¥‏ ابحث عن مقالة تتناول طبيعة البيانات» 
وإدارة البيانات» و/ أو تقنين البيانات من حيث صلتها بذكاء الأعمال والتحليلات» Jie e‏ 
محتوى المقالة بشكلٍ نقدي. 
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الفصل الثاني 


ع- انتقل إلى مستودع بيانات Ae gama 235-9 (archive.ics.uci.edu/ml/datasets.html) UCI‏ 
كبيرةً من البيانات تحتوي على كلّ من القيم الرقمية والقيم الاسمية. Microsoft ela&zal‏ 
Excel‏ و á‏ برنامج إحصائي آخر: 

-١‏ قم بحساب وتفسير مقابيس التّزعة المركزية لكل متغير. 
؟- قم بحساب وتفسير مقاييس التشئَّت/ الانتشار لكلّ متغير. 

-٥‏ انتقل إلى مستودع بيانات «(archive.ics.uci.edu/ml/datasets.html) UCI‏ ود 
مجموعتين من البيانات» إحداهما ل التقدير/ الانحدار والأخرى للتصنيف. باستخدام 
Microsof Excel‏ أو آَیّ پرنامج إحصائی آخر: 

-١‏ قم بتطوير وتفسير نموذج انحدار خطّي. 
'- قم بتطوير وتفسير نموذج انحدار لوجستي. 

KKDnuggest.com g$s» (J] Jà3l -1‏ وتعرّف على مجموعة موارد التحليلات المتاحة على هذه 
البوابة. ثم حَدّد مقالةً أو ورقةً بيضاء. أو نضًا للمقابلة يتناول طبيعة البيانات» و/ أو إدارة 
البيانات» و/ أو تقنين البيانات؛ من حيث صلتها بذكاء الأعمال وتحليلات الأعمال, ثم حلّل 
محتوى المقالة بشكلٍ نقدي. 

Jäs! .[“The Perceptual Edge” (perceptualedge.com)] انتقل إلى مُدوَّنة ستيفن في‎ -V 
قسم‎ 335 .dundas.com إلى قسم ”أمثلة“. اقرأ بعضًا من هذه الأمثلة. اذهب الآن إلى‎ 
ف امموقع. بعد ذلك انقر على ”04۲۵ء0 اهازع5“. سيعرض لك مجموعةٌ‎ “Galery” 
متنوعةً من العروض التوضيحية المختلفة للوحة المعلومات. قم بتشغيل اثنين من هذه‎ 
العروض التوضيحية.‎ 

-١‏ ما هي أنواع المعلومات والمقاييس التي تظهر في العروض التوضيحية؟ وما هي أنواع 
الإجراءات التي يمكنك اتخاذها؟ ١‏ 

-Y‏ باستخدام بعض المفاهيم الأساسية من gS Few si‏ بوصف بعض نقاط التصميم الجيدة 
ونقاط التصميم السيئة للعروض التوضيحية. 

eè -A‏ بتنزيل أداة 55.23 .Spotfire o QlikView sl Tableau Ji» «Slsglell‏ ]13 6 يكن لدى 
مدرستك اتفاقية تعليمية مع هذه الشركات؛ فستكون النسخة التجريبية كافية لهذا التمرين. 
استخدم بياناتك الخاصة (إذا كان لديك أي منها) أو استخدم إحدى مجموعات البيانات 
التي تأتي مع الأداة (وعادةً ما تحتوي على مجموعة بيانات واحدة أو أكثر لأغراض العرض 
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التوضيحي). قم بدراسة البيانات» وافترض مش كلتين من ابتكارك من مشكلات الأعمال» 
واستخدم التصوير البياني للبيانات لتحليل وعرض هاتين المشكلتين, ثم اقترح حلا محتملًا لهما. 

.teradatauniversitynetwork.com :,J] Jäsl -4‏ ابحث عن ”مشروع برنامج ."Tableau‏ !13 
الوصفء نقذ ا مها ثم أجب عن الأسئلة. 

Q£ Vou. .teradatauniversitynetwork.com : Jl JJ à -V-‏ مهام تحليلات 545 المرئية. 
باستخدام المعلومات والإرشادات من نوع خطوة بخطوة المتوفرة في المهمة؛ قم بتنفيذ 
SAS Visual Analytics ll Jie Jd‏ )23 نظام يدعم الويب ولا يتطلب أيّ ca‏ 
محلي). أجب عن الأسئلة المطروحة في المهمة. 

-١‏ ابحث عن مقالتين على الأقل (إحداهما مقالٌ صحفي والآخر ورقة بيضاء) تتحدثان عن 
so‏ القصصء وخصوصًا في سياق التحليلات (أيْ: سرد القصص القائم على البيانات). اقرأ كلا 
من المقالة والورقة ثم قُمْ بتحليلهما بشكلٍ نقديء واكتب تقريرًاً يعكسٌ فهمك وآراءك حول 
أهمية السرد القصصي في ذكاء الأعمال وتحليلات الأعمال. 

Data.gov JI Jäs -yY‏ - وهي بوابة بيانات ترعاها حكومة الولايات المتحدة - والتي تحتوي 
على عدد كبيرٍ Be‏ من مجموعات البيانات حول مجموعة متنوعة من الموضوعات التي تتراوح 
من الرعاية الصحية إلى التعليم, والمناخ والسلامة العامة. اختر موضوعًا يشغل بالك كثيرا. 
انتقل من خلال المعلومات الخاصة بهذا الموضوع والشرح المقدَّم على الموقع. استكشف 
إمكانيات تنزيل البيانات» واستخدم أداتك المفضلة للتصوير البياني للبيانات لإنشاء معلومات 
ومقاطع مرئية ذات معنّى خاص بك. 


مهام فريق ومشروعات لعب الأدوار: 

-١‏ يبدأ التحليل بالبيانات. إن تحديد البيانات ذات الصّلةَ والوصول إليها والحصول عليها ومعالجتهاء 
هي أهم المهامٌ في أيّ دراسة تحليلية. بصفتك فريقاء يتم تكليفك بالبحث عن بيانات واقعية 
كبيرة ها يكفي (إما من مؤسستك الخاصةء وهذا هو الخيار الأفضلء أو من الإنترنت والتي يمكن 
hus ol‏ ببحث بسيطء أو من روابط البيانات المنشورة على (KDnuggets.com‏ والتي لديها 
عشرات الآلاف من الصفوف وأكثر من ٠١‏ متغيرًا لتتناول وتوثق المشروع الشامل للمعالجة 
المسبقة للبيانات. في معالجتك للبيانات؛ حَدّد الشذوذات والتناقضات باستخدام طرق ومقاييس 
الإحصاء الوصفيء واجعل تحليلات البيانات جاهزةً. قم بإعداد قائمة مع التبرير لخطوات 
معالجتك المسبقة وقراراتك في تقرير شامل. 
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(dundas.com, idashboards.com, enterprise-dashboard.com) «59 35a (J] J &31 -Y 
والمزؤّد بمعلومات لوحة المعلومات المعروفة جيدًا؛ إذ توفّر هذه المواقع عددًا من الأمثلة على‎ 
لوحات التحكُّم التنفيذية. وبصفتك فريقاً اختر صناعةً معينةٌ (مثل: الرعاية الصحية» أو‎ 
الخدمات المصرفية, أو الخطوط الجوية). حَدَّد موقع بعضٍ من الأمثلة للوحات معلومات‎ 
هذه الصناعة. قم بِوَصْف أنواع المقاييس الموجودة في لوحات المعلومات. ما هي أنواع‎ 
شاشات العرض التي يتم استخدامها لتوفير المعلومات؟ وباس تخدام ما تعرفه عن تصميم‎ 
لوحة المعلومات» قم بتوفير نموذج مبدئي لورقة لوحة معلومات لهذه المعلومات.‎ 

.teradatauniversitynetwork.com JI |J à3l -Y‏ ومن هناك؟ انتقل إلى مصادر بيانات جامعة 
أركنساس. اختر واحدة من مجموعات البيانات الكبيرة وقم بتنزيل عدد كبير من السجلات 
(قد يتطلّب ذلك منك كتابة عبارة :50[1 التي تقوم بإنشاء المتغيرات التي تريد تضمينها في 
مجموعة البيانات). اطرح ٠١‏ أسئلة على الأقل يمكن معالجتها باستخدام تصوير المعلومات. 
ثم باستخدام أداتك المفضّلة لتصوير البيانات (ولتكن 1861680), حلل البيانات ثم قم بإعداد 
تقرير مُفْصّل يتضمن لقطات شاشة وصور مرئية أخرى. 
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ذكاء الأعمال ومستودعات البيانات 


أهداف التعلم: 
- فهم التعريفات والمفاهيم الأساسية لمستودعات البيانات. 
- فهم فنيات مستودعات البيانات. 
- وَضْف العمليات المُستخدّمة في تطوير وإدارة مستودعات البيانات. 
- شَرْح عمليات مستودعات البيانات. 
c -‏ دور مستودعات البيانات في ess‏ القرار. 
t -‏ تكامل البيانات» وعمليات الاستخراجء والتحويل والتنزيل (81:1). 
- 3$ جوهر إدارة أداء الأعمال (BPM)‏ 
- تعلّم بطاقة الأداء المتوازن وستة سيجما كنُظُّم قياس الأداء. 
لقد كان مفهومٌ مستودعات البيانات موجودًا منذ أواخر الثمانينيات. يُقدِّم هذا الفصل 
الأماسٌ لنوع مهم من قواعد البيانات» يُسمّى مستودع البيانات» والذي يُستَخِدّم أساسًا لدعم 
القرار ويوفر الأساس المعلوماتي لتحسين القدرات التحليلية. وسنناقش مفاهيم تخزين البيانات 
وما يرتبط بذلك» وكذلك إدارة أداء الأعمال في الأقسام التالية. 
۱-۳ مقال افتتاحی: استهداف الاحتيال الضريبى مع ذكاء الأعمال» ومستودعات البيانات: 
cis‏ على الحكومات أن gid Šou dasi‏ التهرّب الضريبيء والذي يؤدي إلى تناقص ملحوظ 
في عائداتها. ففي عام 1 ١/ام؛‏ نجحت إدارة العائدات الداخلية (1115) في إجهاض محاولات 
من مجهولين» كانت تستهدف خداع الحكومة الفيدرالية في مبلغ ۲۲ ,۲ مليار دولار من مبالغ 
الضرائب. ومع ذلك s‏ نفس «ell‏ خسرت مصلحة الضرائب الأمريكية ٩ gl‏ ,۸ ملیار دولار 
على مطالبات تمّ إدراجُها في وقتِ لاحق تحت بند التهرّب الضريبي. 
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كما تخسر الولايات الأمريكية أيضًا الكثير من الأموال عندما يستخدم المحتالون أرقام الضمان 
الاجتماعي المسروقة» ونماذج 3187-2 وغيرها من المعلومات الشخصية لتقديم مطالبات مزيفة. وقد 
زاد هذا النوع من الجرائم في السنوات الأخيرة بمعدلٍ يُنذر بالخطر. يقول بيتر فرانشوت, المراقب 
dios UI‏ ماريلائد: «لقد سمع S‏ الأمريكيين تقريبًا عن سرقة الهوية؛ لكن القليل منهم فقط 
كان على دراية بهذه الزيادة الهائلة في تزوير العائدات الضريبية. إن هذه المشكة المزعجة تؤثر 
على كلّ دول العالم. وهذا ما يعرف - حرفيًا - بالسطو الممنهج على أموال دافعي الضرائب». 

في ولاية ماريلاند؛ كان الأشخاص المتهمون بتزييف مطالبات الاسترداد أعضاءً في فريق الكشف 
عن العائد المشكوك فيه (01101). ومثل نظرائهم في العديد من الولايات الأخرى» يستخدم 
هؤلاء الخبراء البرمجيات؛ لتحديد العوائد المشبوهة. ثم يقومون بعد ذلك بالتحقيق في العائدات 
لتسليط الضوء بدقة على الاحتيالي منها. 
التحدي: 

في الماضي؛ كانت ولاية ماريلائند تستخدم مقاييسٌ لفحص الإقرارات الضريبية واحدًا تلو الآخر. 
فإذا انّسَم العائدُ بصفات مُحدّدة - مثل: نسبة معينة من الأجور المكتسبة إلى الأجور المحتجزة 
- قامت البرمجيات بتعليق ذلك العائد لحين التحقيق فيه. ثم قام أعضاء ۸21 بالنظر في 
كل العائدات امعلقة؛ وذلك عن طريق مقارنة الأجر وامعلومات ا محجوبة بالأرقام المقدّمة من 
نموذج ۷-2 الذي تم استلامه من قبل صاحب العمل. كانت العملية كثيفة العمالة وغير فعالة. 
ومن أصل ما يقرب من A, Y‏ مليون عائد ضريبي كانت تحصل عليه ميريلائد كلّ عام قام أعضاء 
فريق :0181 بتعليق حوالي ٠٠٠٠١‏ منها. ولكن تبَيّن أن معظم تلك العائدات كانت عائدات 
مشروعة. يقول آندي شاوفيل» مدير مكتب تقديرات الإيرادات لمراقبة حسابات ولاية ماريلائد: 
«لقد تبَيّن لنا أن “٠١‏ فقط من المموّلين كانوا مخادعين». 

في سنة نموذجية؛ أنقذت تلك العملية ولاية ماريلاند من سداد ما بين ه إلى ٠١‏ ملايين 
دولار كمطالبات استرداد مزيفة. وعلى الرغم من نجاح ذلك؛ فإنها تُعَنُ مجرد حل متواضع» مع 
الأخذ بعين الاعتبار الموارد المرتبطة بالعملية وإزعاج دافعي الضرائب المخلصين الذين تم تحديد 
عوائدهم للتحقيق. يقول شاوفيل: «كان التفكير في أننا كنا نعلق ما بين 5٠٠٠١‏ و ٠‏ عملية 
استرداد للضرائب أمرًا صعبًا. لقد أردنا الحصول على هذه المبالغ المستردّة لدافعي الضرائب 
بشكل أسرع؛ إذ يعتمد الكثيرٌ من الناس على هذا الال كجزءِ من دخلهم». 
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الحل: 

احتاجت ماريلاند إلى عملية أكثر فعالية. كما احتاجت إلى إستراتيجيات جديدة لاستمرار 
السيطرة على المحتالين. يقول شاوفيل: «كانت جميع الولايات» وكذلك مصلحة الضرائب الداخلية 
5 يستخدمون جميعًا نفس المقاييس التي كنا نستخدمهاء ولا أعتقد أنه كان من الصعب على 
المجرمين معرفة الإجراءات الاحترازية التي نتبعها». ولحُسن الحظ؛ حصلت ماريلاند مؤخرًا على 
سلاح جديدٍ قويّ ضد التهرب الضريبي. في عام ١٠١۲م‏ عمل مراقب الخزينة في ماريلاند مع 
شركة 01ر2 گە »1eradata‏ بولاية أوهايى لتنفيذ مستودع بيانات مُصمّم لدعم مجموعة 
متنوعة من مبادرات الامتثال. 


وبينما كان المسؤولون يناقشون المبادرات التي يجب إطلاقها؛ طفت فكرةٌ واحدةٌ على السطح. 
تقول شارون بونارديء نائبة مراقب ولاية ماريلاند: «لقد قرّرنا أننا يجبٌ أن نعطي الأولوية 
لجهودنا الرامية إلى تعقب الاحتيال في استرداد الأموال». لذا بدأت الولاية العمل مع تيراداتا ومع 
شركة دعنالإلهمة 512 في بوتوماك بولاية ماريلاند؛ لتطوير عملية أفضل لعزل الإقرارات الضريبية 
الاحتيالية )2013 .(TempleWest,‏ 

يقول شاوفيل: «كانت الخطوة الأولى؛ هي تحليل بياناتنا وتعلّم ما هكن تعلّمه عن الاحتيال». 
ومن بين الاكتشافات الأخرى؛ أظهر التحليلٌ أنه عندما يتم تعليق عائدات متعددة - حتى لأسباب 
مختلفة تمامًا - فإنها غالبًا ما تكون لها سمات مشتركة. قامت الولاية ببناء قاعدة بيانات للسمات 
التي تمبّز الخصائص الاحتيالية للعائدات» وكذلك للسمات التي يتميّز بها الشرفاء. يقول شاوفيل: 
ASR ga lilas s Äl»‏ لوضع هذه المعلومات معّا وتطوي ر الانحدارات الخطيةء وبدلا من النظر 
إلى المقاييس المنفردة بذاتها؛ شرعنا في تطبيق فكرة الجمع بين العديد من هذه المقاييس معًا». 
وكانت النتيجة صورةً أكثر دقة من حيث درجات الاختلاف للعائد الاحتيالي المعتاد. 

ia Va os‏ تعاقب العائدات الضعيفة واحدًا تلو الآخر؛ يُحدّد النظام الجديد مجموعات 
العائدات التي تبدو مشبوهةً لأسباب مماثلة. تجعل هذه الإستراتيجية عملية التحقيقات تسيرٌ 
QS a‏ أسرع. ويُحدّد نظام التحليلات أيضًَا درجةً لكل عائد؛ وذلك بناءً على مدى احتمالية 
كونه احتياليًا. ثم ينتج بعد ذلك قائمة ذات أولوية لتوجيه سَيْر عمل '0881. يقول شاوفيل: 
«نحن نعمل أولا على العائدات التي من الأرجح ألا تكون احتيالية؛ ولذا يمكننا إخراجها من AEB‏ 
الانتظار». ثم تعود العائدات الأكثر شبهةٌ للمراجعة مرةٌ أخرى. 
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النتائج: 

يقول بوناردي: «بفضل نماذج التحليلات هذه؛ يمكننا تقليلٌ القيّم الموجبة الخاطئة, حتى لا 
نثقل على كاهل دافعي الضرائب الذين قدَّموا إقراراتهم الضريبية بدقة إلى الولاية». وبمجرد أن 
يزيل المحققون عائداتهم من قائمة الانتظار؛ يصبح بإمكان دافعي الضرائب استرداد مطالباتهم 
التي حُصَّلّتَ منهم بالخطأً. 

وبفضل التقنية الجديدة؛ تنوقع ۸21 تعليق ما يتراوح من ٠٠٠٠١‏ إلى 00٠٠١‏ فقط من 
العائدات الضريبية» مقارنة ب ٠5٠٠٠١‏ في السنوات الماضية. يقول شاوفيل: «من بين كل هؤلاء 
الذين عملنا معهم حتى الآن؛ نحصل على نسبة دقة تصل إلى 719 تقريبّا». ويُعَدُ ذلك تحسّنًا 
رائعًا مقارنةَ معدل النجاح التاريخي البالخ ×٠١‏ فقط. ويقول فرانشوت, المراقب المالي لماريلائد: 
«مجدد أن يتم تحديدٌ العائدات التي قد تكون احتياليةء هكن لفريق الخراء الممتحنين أن 
يراجعها بعناية» في وقتٍ واحد؛ لإزالة تلك العائدات التي تثبت عدم شرعيتها. وبذلك تتحشّن 
العملية بِرُمّتها بشكلٍ أفضل طوال الوقت». 

وفي أواخر مارس من نفس العام؛ ساعدت التحليلات المتقدّمة فريق 0121 على استرداد 
حوالي ٠١‏ مليون دولار في موسم الإيداع الحالي. يقول شاوفيل: «في ظل النظام القديم» كان هذا 
الرقم يبلغ حوالي ملايين دولار في هذه المرحلة». ولا pasi‏ دور التقنية الجديدة فقط على 
تيسير عمل 011 بشكلٍ أسرع وأكثر كفاءة؛ ولكنها أيضًا تساعد الفريق على التعامل مع عبء 
العمل الأكثر تعقيدًا. وعندما زاد ا متهرب ون من الضرائب من جهودهم» لجأ فريق ۸2 إلى 
نَشْر إستراتيجيات جديدة ضدهم. فعلى سبيل المثالء في عام 16١7م‏ تلقّى الفريق حوالي ٠١٠٠١‏ 
إخطار من دافعي الضرائب الذين تت سرقة هوياتهم. يقول شاوفيل: «إذَا لدينا سَيْر عمل 
جديد: وهو البحث عن أرقام الضمان الاجتماعي الخاصة بهم ومحاولة العثور على أيّ حوادث 
تزوير قد تكون أرتكبّت معهم. ويُعَذُ هذا مستوّى جديدًا من الجهود التي تُكّملها هذه المجموعة 
الآن بدون موارد إضافية». 

وللمحافظة على مُخططات ضريبية أكثر تطوراً لا يقوم المحققون الآن بفحص استمارات ۷-2 
الحالية فحسب؟ بل يقومون أيضًا بمقارنتها باستمارات نفس الممولين من السنوات السابقة؛ بحنًا 
عن التناقضات. ويضيف شاوفيل: «أصبحت التحقيقات أكثر تعقيدًا واستغراقًا لوقت أطولء وإذا 
لم تتم مراجعة تلك الإجراءات بعناية؛ فستلاحقنا بلا شك بعض المشكلات الحقيقية». 
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أسئلة على المقالة الافتتاحية: 

-١‏ لماذا من المهمٌ لمصلحة الضرائب الأمريكية ولحكومات الولايات الأمريكية استخدام أدوات 
مستودعات البيانات» وأدوات ذكاء الأعمال في إدارة الدخل القومي؟ 

-Y‏ ما هي التحَدّيات التي تواجه ولاية ماريلاند فيما يتعلّق بالتهرب الضريبي؟ 

*- ما هو Jodl‏ الذي اعتمدوه؟ وهل توافق على طريقتهم؟ ولماذا؟ 

-٤‏ ما هي النتائج التي حصلوا عليها؟ وهل نجح الاستثمار في (ذكاء الأعمال) ومستودعات البيانات؟ 

-٥‏ ما هي المشكلات والتحَدّيات الأخرى التي تعتقد أن تواجهها الحكومات الفيدرالية وحكومات 
الولايات» والتي يمكن أن تستفيد من ذكاء الأعمال ومستودعات البيانات؟ 


ماذا يمكننا أن نتعلّم من هذه المقالة الافتتاحية القصيرة؟ 

uos‏ المقالة الافتتاحية قيمة ذكاء الأعمال وأنظمة دعم القرارء ومستودعات البيانات في 
إدارة الإيرادات الحكومية. مع تنفيذ مستودع البيانات الخاصة بهم, تمكّنت ولاية ميريلاند 
من الاستفادة من أصول البيانات الخاصة بها؛ لاتخاذ قرارات أكثر دقة وفي الوقت المناسب 
حول تحديد الإقرارات الضريبية الاحتيالية. وبتنفيذهم لفكرة مستودع البيانات, تمكّنت ولاية 
ماريلاند من الاستفادة من أصول البيانات الخاصة بها بشأن اتخاذ قرارات أكثر دقة وفي الوقت 
المناسب؟ وذلك فيما يتعلق بتحديد الإقرارات الضريبية الاحتيالية. وقد أتاح دَمْجِ ومعالجة 
مجموعة واسعة من مصادر البيانات داخل مستودع بيانات موحد لولاية ماريلاندء تحديد 
إشارات/ قواعد/ سمات الاحتيال الضريبي من الحقائق التاريخية بصورة أو توماتيكية بدلا 
من الاعتماد فقط على الطرق التقليدية؛ إذ تمّ تطبيق قوا عد التصفية القائمة على الحدس. 
وباستخدام مستودعات البيانات وذكاء الأعمال, LÉE‏ ولاية ماريلاند من تقليل مُعذَّل القيم 
الموجبة الخطأ بشكل ملحوظ (وبذلك تمّ تخفيف العبء الضريبي على الممولين) كما تمَكنَت 
من تحسين معدل دقة التنبؤ من “٠١‏ إلى 10 (أي أكثر من ستة أضعاف التحسن في دقة 
تحديد الإقرارات الضريبية الاحتيالية). ويُعَنَ الدرس الرئيس هنا هو أن مستودع البيانات 
المصمّم والمنقّدْ بشكلٍ صحيح مع أدوات وتقنيات ذكاء الأعمال يمكن أن يؤدي إلى تحشّن 
معنوي (سواء على مستوى الدقة أو التوقيت)؛ مما يؤدي إلى فوائد (مالية أو غير مالية) لأيّ 
منظمة. بما في ذلك حكومات الولايات مثل ماريلاند. 
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۲-۳ ذكاء الأعمال ومستودعات البيانات: 

لقد كان ذكاءٌ الأعمال» كمصطلح لوضف عملية اتخاذ الق رار الإداري القائم على 
الحقائق/ الدليلء موج ودا منذ أكثر من Lalo Y*‏ ومع ظهور تحليلات الأع مال ككلمة رنّانة 
جديدة لوصف نفس الظاهرة الإدارية إلى حَذَّ كبير؛ فقد انخفضت شعبية مصطلح ذكاء الأعمال. 
وعلى عكس كونه مصطاحاً شاملا يُستَخِدّم ذكاء الأعمال في الوقت الحاضر لوصف المراحل 
المبكرة لتحليلات الأعمال (أيْ: التحليلات الوصفية). 

esi‏ الشكل ١"‏ (والذي تم عَرْضِ وشَرْح نسخة مُبِسّطة منه في الفصل الأول لوصف 
تصنيف تحليلات الأعمال) العلاقة بين ذكاء الأعمال وتحليلات الأعمال من منظور مفاهيمي. وكما 
هو مُوضّح هنا؛ فإن ذكاء الأعمال هو جزءٌ تحليليٌ وصفيٌّ من سلسلة تحليلات الأعمال؛ إذ يؤدي 
نضجها إلى تحليلات متقدمة - وهي مزيجٌ من التحليلات التنبؤية والإلزامية. 

تُعَدُ التحليلات الوصفية (أَيْ: ذكاء الأعمال) مستوّى مبدئيًا للدخول في تصنيف تحليل 
الأعمال. وغالبًا ما يُطلّق عليها اسم إعداد تقارير النشاط التجاري؛ بسبب حقيقة أن معظم 
أنشطة التحليلات في هذا المستوى تتعامل مع إنشاء تقارير لتلخيص الأنشطة التجارية للإجابة 
عن أسئلة, مثل: «ماذا حدث؟» و«ما الذي يحدث؟». تشمل هذه الحزمة من التقارير لقطات 
ثابتة لمعاملات الأعمال التي تمّ تسليمها إلى العاملين في مجال المعرفة (أَيْ: صُناع القرار)؛ وذلك 
وفقًا لجدول زمني ثابت (يوميء أو أسبوعيء أو ربع سنوي)؛ وكذلك تقارير مُخصّصة Š‏ 
صانع القرار من إنشاء تقريره الخاص (باستخدام واجهة مُستخدم رسومية حدسية مُسطحة) 
لمعالجة حالة قرار مُحدَّدة أو فريدة من نوعها؛ وأيضًا وجهات نظر ديناميكية لمؤشرات أداء 
الأعمال الرئيسة (والتي غالبًا ما يتم التقاطها وعرضها في نظام إدارة أداء الأعمال) يتم تسليمها 
إلى المديرين والموظفين التنفيذيين في شكلٍ سهل الاستيعاب (مثل: واجهات رسومية تظهر كلوحة 
معلومات) بطريقة مستمرة. 


Sources: Teradata case study. (2016). Targeting tax fraud with advanced analytics. http://assets.teradata. 
com/resourceCenter/downloads/CaseStudies/EB7183 GT16 CASE STUDY Teradata V.PDF (accessed 
June 2016); Temple-West, P. (2013, November 7). Tax refund ID theft is growing "epidemic": U.S. IRS 
watchdog. ^ Reuters. — http://www.reuters.com/article/us-usa-tax-refund-idUSBRE9A61HB20131107 
(accessed July 2016). 
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شكل :1-١‏ العلاقة بين تحليلات الأعمالء وذكاء الأعمال» وتخزين البيانات 

بشكلٍ عام؛ وكما هو مُبيّن في الشكل (1-1)» تعتمد أنظمة ذكاء الأعمال على مستودع البيانات 
كمصدر للمعلومات؛ من أجل إنشاء ودَّعْم القرارات الإدارية. إذ يتم التقاط العديد من البيانات 
التنظيمية والخارجية وتحويلها وتخزينها في مستودع بيانات لدعم القرارات الدقيقة في الوقت 
المناسب من خلال نظرة عميقة للأعمال. ويهدف هذا الفصل إلى تغطية المفاهيم والطرق 
والأدوات المتعَلّقة بمستودعات البيانات وإدارة أداء الأعمال. 





ما هو مستودع البيانات؟ 

بعبارة بسيطة؛ َد مستودع البيانات )0W(‏ تجمعاً من البيانات التي يتم إنتاجها لدعم 
عملية صُنْعَ القرار. وهو أيضًا منطقةٌ غنيةٌ بالبيانات الحالية والتاريخية والتي من المحتمل أن 
تكون ذات أهمية كبيرة في المسقبل بالنسبة للمديرين في جميع أقسام المنظمة. وعادةٌ ما تكون 
البيانات مهيكلةٌ؛ بحيث تظهر في صيغة جاهزة لأنشطة امعالجة التحليلية (أي: امعالجة التحليلية 
عبر الإنترنت [01.42)]. التنقيب قي البياناتء الاستعلام إعداد التقاريرء وغيرها من تطبيقات دعم 
القرار). إن مستودع البيانات؛ هو عبارة عن مجموعة موضوعية ومتكاملة وموجهة زمنيًا وغير 
متطايرة من البيانات لدعم العملية الإدارية المتعلقة باتخاذ القرارات. 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري vvv‏ 


الفصل الثالث 


منظور تاريخي لمستودعات البيانات: 

على الرغم من أن مستودعات البيانات هو مصطلح جديد نسبيًا في تقنية المعلومات (11)؛ 
فإنه من الممكن تتيّع أصوله التاريخية» وحتى من قبل التوشّع في استخدام أجهزة الحاسب. ففي 
أوائل القرن العشرين؛ كان الناس يستخدمون البيانات (بالطرق اليدوية) لصياغة الاتجاهات التي 
تساعد مستخدمي الأعمال في اتخاذ قرارات مستنيرة. وهو أكثر الأغراض السائدة في مستودعات 
البيانات. وترجع - تاريخيًا - الدوافع التي أدّت إلى تطوير تقنيات مستودعات البيانات إلى حقبة 
السبعينيات» عندما هيمنت المركزية على عالم الحوسبة. وقد امتلكت تطبيقات معالجة البيانات 
التجارية الحقيقية - والتي يتم تشغيلها على أجهزة الحاسب المركزية للشركات - هياكل ملفات 
معقدة باستخدام الجيل المبكر من قواعد بيانات (وليست قواعد البيانات الجدولية المُستَخدّمة 
في معظم التطبيقات في الوقت الحالي) والتي يتم إيداع البيانات بها. وعلى الرغم من أن هذه 
التطبيقات قَدَّمَت أداءً جيدًا في وظائف معالجة البيانات للمعاملات الروتينية؛ E‏ البيانات التي تم 
إنتاجها من أداء هذه الوظائف (مثل: المعلومات المتعلقة بالعملاء» وا منتجات التي يطلبونهاء والأموال 
التي ينفقونها) قد تمّ دفنها بعيدًا في أعماق الملفات وقواعد البيانات. وعندما ظهرت الحاجة إلى 
معلومات مُجِمّعة مثل: اتجاهات المبيعات بحسب المنطقة ونوع المنتج» كان ينبغي أن تطلب رسمياً 
من قسم معالجة البيانات؛ إذ تم وَمْعَ ذلك الطلب في قائمة انتظار تضم مئات من طلبات التقارير 
الأخرى (2009 es -(Harimergren & Simon,‏ الرغم من ظهور الحاجة إلى المعلومات والبيانات 




















امُستخدّمة لتوليد تلك المعلومات؟ ob‏ تقنية قواعد البيانات لم تكن موجودة 6 لتحقيق ذلك. ويُوضُح 
Y-Y JSA‏ جدولًا زمنيًا يظهر فيه بعض الأحداث المهمة التي أذّتَ إلى تطوير مستودعات البيانات. 
تحليلات البيانات الضخمة التخزين المركزي البرائات أجهزة الكمبيوتر الرئيسية 
تحليلات وساتل التولصل الاجتماعي Vierte fo daban, f‏ 
تحليلات النص والويب | + Inmon‏ وبناء مستودح البيئات ‏ ⁄ إعداد التقارير الروتينية | 7 
Kimball v Hadoop, MapReduce, NoBDL‏ زنر عا رت ودع يفت ي 2 هياكل قاعدة البيانات الارلية ⁄ 
Y In-mernory, database‏ اتصمیم بنية Yoo dla EDW‏ 
A 1920s — À»— — 1980; — »— — 1980s —3—- 2000s py 2010s‏ 
بهانات الويب المتنامية بشكل كبير 7 أجهزة الكمبيوتر الشخصيةالصغيرة. (909) ا 
اندعيم صناعة 210/131 7 تطبيقات الأعمال (PCS)‏ * 
اظهور أجهزة مستودع البيانات  VO‏ موزع DBMS‏ , - 
ازدياد شعبية ذكاء الاعمال 1 5 العلانقی J‏ 
ad DBMS "A babere gratis‏ التجارية تيرادقا ر 
البرامج المجاتية + تأسيس مستودع بيائات الأعمال ر 
isis X, SaaS Pans.‏ 35 











شكل 8-؟: قائمة الأحداث التي أذَّت إلى تطوير تخزين البيانات 
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في أواخر القرن الماضي؛ ظهرت شركات تجارية تعمل على تطوي ر الأجهزة والإرمجيات» وقد 
شهد ظهور تلك الشركات بعض الحلول لهذه المشكلة. وقد انبثق بین gale‏ ۱۹۷۲۱ و۱۹۷۹م 
مفهوم شركة جديدة - تيراداتا - من الأبحاث في معهد كاليفورنيا للتقنية (ء08116). مستندةٌ 
على مناقشات أجرِيّت مع مجموعة التقنية المتقدّمة في 6لهه01]16. وقد عمل المؤسسون على 
تصميم نظام لإدارة قواعد البيانات للمعالجة المتوازية مع المعالجات الدقيقة المتعددة» والتي 
تستهدف بشكلٍ خاصٌ دعم القرار. وفي 1١‏ يوليو 1515م تمَّ تأسيسٌُ تيراداتا رسميًاه وقد بدأت في 
جراج في 181600004, بولاية كاليفورنيا. وقد e‏ اختيار اسم تيراداتا لترمز إلى القدرة على إدارة 
تيرابايت (تريليونات من الحروف) من البيانات. 

كانت الثمانينيات هي عقد الحواسيب الشخصية والحواسيب الصغيرة. وقبل أن يعرفها 
b Aoi‏ تَعْد تطبيقات الحاسب الحقيقية موجودةً على أجهزة الحاسب المركزية فقط؛ بل كانت 
موجودةً في كلّ مكانٍ يمكن أن تتواجد فيه أي منظمة؛ مما تسبب في ظهور مُشكلة خطيرة تُسمّى 
جزر البيانات. وقد Jo sôi‏ هذه المشكلة إلى نشأة نوع جديد من البرمجيات. يُسمّى نظام إدارة 
قاعدة البيانات الموزّعة, والذي من شأنه سَحْب البيانات المطلوبة بطريقة سحرية من قواعد 
البيانات من جميع أقسام المنظمة وإعادة جميع تلك البيانات مرةٌ أخرى إلى نفس المكان» ثم 
دمجهاء وفرزهاء وعمل كل ما يلزم للإجابة عن سؤال المستخدم. وعلى الرغم من كون المفهوم 
جيدًا وكذلك كون النتائج المبكرة من الأبحاث واعدة؛ فإنها كانت نتائج عادية وبسيطة؛ فهي لم 
تعمل بكفاءة على أرض الواقع» وبالتالي ظلت مشكلة جزر البيانات قائمة. 

وفي الوقت نفسه؛ بدأت تيراداتا في شَحْذْ كلّ اهتماماتها تجاه ابمنتجات التجارية المتعلقة بحل 
هذه المشكلة. وقد حصل بنك ويلز فارجو على أول نظام اختبار تيراداتا في عام 19/417م: وهو أحد 
أنظمة إدارة قواعد البيانات العلائقية (828115) وهو نظامٌ مواز das bI esu‏ الأول من 
نوعه في العالم. وبحلول عام 1946م: أصدرت تيراداتا نسخة من منتجهاء وفي عام 1987م أطلقت 
مجلة ۴«ںاإه۴ على تيراداتا لقب «منتج العام». وقد قام منتج تيراداتا - والذي لا يزال 68 حتى 
اليوم - ببناء أول جهاز طمستودعات البيانات» وهو عبارة عن مجموعة من الأجهزة والبرمجيات 
لتلبية احتياجات مستودعات البيانات للكثير من المتعاملين في هذا الحقل. وبدأت كذلك العديدٌ 
من الشركات الأخرى في صياغة إستراتيجياتها. 

كما وقعت عدة أحداث أخرى خلال الثمانينيات من القرن الماضي؛ مما أكسبها لقب حقبة 
الابتكار في مستودعات البيانات. فعلى سبيل المثال: أسّس رالف كيمبال أنظمة ع8 260 في 
عام 1987م. بدأت أنظمة 811 264 في الظهور كشركة برمجيات رائدة من خلال مناقشة كيفية 
ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري yya‏ 
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تحسین الوصول إلى البیانات؛ ففي JS pc e VAM ple‏ من باري ديفلين وبول مورفي من TBM‏ 
إيرلندا مصطلح مستودع بيانات الأعمال كمكوّن أساسي لنظم المعلومات التجارية. وفي تسعينيات 
القرن العشرين؛ طفت على السطح طريقة جديدة لحل مشكلة جزر البيانات. وإذا كانت طريقة 
الثمانينيات قد فشات في الحصول على البيانات والوصول إليها مباشرةً من الملفات وقواعد 
البيانات؛ فقد انطوت فلس فة التسعينيات على العودة إلى نهج السبعينيات؛ إذ تم نسُح البيانات 
من تلك الأماكن إلى مكان آخرء ولكن يتم فل ذلك بشكلٍ أكثر دقة. ومن هنا وُلِدَتَ مستودعات 
البيانات. في عام 1951م؛ كتب 101202 18111 كتاب بناء مستودع البيانات. يُصنَّف الكثيرٌ من الناس 
كأب لمستودعات البيانات. وظهرت منشورات إضافية - بما في ذلك كتاب «مجموعة 
أدوات مستودع البيانات» لصاحبه رالف كيمبال 1997م - والتي ناقشت تقنيات تصميم الأبعاد 
ذات الأغراض العامة لتحسين بنية البيانات لأنظمة دعم القرار المرتكزة على الاستعلام. 

ومع بدايات الألفينات, وفي عالم مستودعات البيانات. استمرّت شعبية البيانات في النمو. 
وبدأ اندماج مجتمع المورّدين مع الخيارات. وفي عام ٠١٠۲م‏ استحوذت شركة مايكروسوفت 
tProClarity (Je (Microsoft)‏ ]3 قفزت إلى سوق مستودعات البيانات. وفي عام لا١٠٠م؛‏ 
قامت شرکة أوراکل بشراء Casals Business Objects Ae SAP 392 Luls Hyperion‏ 
1 مع وممع00. لقد التهم قادة أكبر مُزوّدي حلول نظم المعلومات في العام قادة مستودعات 
البيانات في التسعينيات. وخلال هذه الفترة؛ ظهرت ابتكارات أخرىء ما في ذلك أجهزة مستودعات 
البيانات من مُورّدِيها Coo (4UI) GreenPlums (IBM le co352c2ul (7I) Netezza Qa‏ 
s 1s Sols go Cama il (1) DATAllegros (EMC à Jh. $‏ (1/1:0504))» وأجهزة 
إدارة الأداء التي سهّلت عملية مراقبة الأداء بشكل فوري. وقد وقَّرت هذه الحلول المبتكرة 
وفورات في التكاليف؛ لأنها كانت متوافقة في تكوينها مع الحلول القدمة لمستودع البيانات. 

منذ عام ١٠٠۲م؛‏ كانت الضجة الكبيرة هي البيانات الضخمة. يعتقد الكثيرون أن البيانات 
الضخمة ستؤثر في مستودعات البيانات. وحيال ذلك إما أنهم سيجدون طريقة للتعايش (والتي يبدو 
أنها الحالة الأكثر ترجيحًاء على الأقل لعدة سنوات) أو أن البيانات الضخمة (والتقنيات التي تصاحب 
وجودها) ستجعل التخزين التقليدي للبيانات أسلوبًا قدي ومُهِمَلًا. وتتضمّن التقنيات التي جاءت 
مع البيانات الضخمة كلا (Hives NoSQLs MapReduces Hadoop (s‏ وربما أثنا سنكون بصدد 
ظهور مصطلح جديد تتم صياغته في عام البيانات؛ لیجمع بین ظهور مصطلح جدید تمٌ صياغته في عام 
البيانات الذي يجمع بين احتياجات وقدرات التخزين التقليدي للبيانات وظاهرة البيانات الضخمة. 
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خصائص مستودعات البيانات: 
يعد أحد الطرق الشائعة لإدخال مستودعات البيانات؛ هو الرجوغ إلى الخصائص الأساسية 

لتلك البيانات والتي يُعَذٌ من أهمّها (انظر: 2005 X(Inmon,‏ 

- التوجّه بالموضوع: يتم تنظيمُ البيانات حسب تفاصيل الموضوع: مثل: المبيعات» أو المنتجات» 
أو العملاءء والتي تحتوي فقط على المعلومات اللتعلّقة بدعم القرار. ولا مُكّن توجيه الموضوع 
المستخدمين من تحديد كيفية أداء أعمالهم فحسب؛ بل أيضًا ممكُّنهم من معرفة سبب أدائهم 
لتلك المهام. ويختلف مس تودع البيانات عن قاعدة البيانات التشغيلية؛ بحيث يكون لمعظم 
قواعد البيانات التشغيلية توجُه با منتج. ويتمُ ضبطها للتعامل مع المعاملات التي تقوم بتحديث 
قاعدة البيانات. يُوفَر اتجاه الموضوع نظرةً أكثر شمولية للمنظمة. 

- التكامل: يرتبط التكامل ارتباطًا وثيقًا بتوجيه الموضوع. كما يجب على مستودعات البيانات 
أن توفر البيانات القادمة من مصادر مختلفة في شكلٍ متسق. وللقيام بذلك؛ فيجب على 
مستخدمي تلك المستودعات التعاملٌ مع تسمية التعارضات والتناقضات بين وحدات القياس. 
ومن المفترض أن يكون مستودع البيانات متكاملًا تمامّاء 

- التغيّر مع الوقت (سلسلة زمنية): يحتفظ المستودع بالبيانات التاريخية. وليس بالضرورة أن 
توفر البيانات الحالة الحالية (باستثناء الأنظمة الفورية). فهي تكتشف الاتجاهات والانحرافات 
والعلاقات طويلة الأجل للتنبؤ والمقارنات؛ مما يؤدي إلى اتخاذ قرار. ويكون لكلّ مستودع 
بيانات à xis iua) Boso‏ الوقت هو البُعْد الأكثر أهميةً وربما الأوحد الذي يجب أن يتم 
دعمه من قبل جميع مستودعات البيانات. كما تحتوي البيانات اللُجهّزة للتحليل والقادمة 
من مصادر متعددة على نقاط زمنية مختلفة (كالمشاهدات اليومية» والأسبوعية: والشهرية). 

- عدم التطاير(الثبات): فَبُعْد مستودعات البيانات في المستودع, لا يكن للمستخدمين تغيير أو 
تحديث تلك البيانات؛ إذ يتم تجاهل البيانات القدهة» ويتم تسجيل التغييرات كبيانات جديدة. 

هذه الخصائص السالفة الذكر تمكّن مستودعات البيانات ليتمٌ ضبطها بشكل حَضْري تقريبًا 

لمهمة الوصول إلى البيانات. كما تُوجَّد خصائص أخرى إضافية للبيانات والتي تتضمّن ما xa‏ 

- الارتكاز على شبكة الإنترنت: يتم تصميمٌ مستودعات البيانات عادةً لتوفير بيئة حوسبة فعّالة 
للتطبيقات المستندة إلى الويب. 

- العلائقية/ متعددة الأبعاد: يستخدم مستودعٌ البيانات ousia áo gÍ LA dco GS]‏ الأبعاد. 
ويمكن العثور على دراسة استقصائية حديثة حول الهياكل المتعددة الأبعاد في روميرو وأبيلو (YA)‏ 
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- خدمة العملاء: يَستخدمٌ مستودع البيانات فنَّ خدمة العملاء؛ لتوفير وصول سهل للمستخدمين النهائيين. 
- الفورية: توفّر مستودعات البيانات الأحدث إمكانيات الوصول إلى البيانات وتحليلها بشكل 
فوري أو -(Basu, 2003; Bonde & Kuckuk, 2004 : 3l) Ja5‏ َّ 
- الاشتمال على البيانات الوصفية: يحتوي مستودع البيانات على بيانات وصفية (بيانات عن 
البيانات) حول كيفية تنظيم البيانات وكيفية استخدامها بفعالية. 
في الوقت الذي يُعَدُ فيه مستودعٌ البيانات مكاناً آمناً للبيانات» تُعَدُ مستودعات البيانات 
العملية برمتها حرفيًا (انظر: 2002 (Watson.‏ | تُعَنّ مستودعات البيانات نظامًا ينتج عنه 
تطبيقات توفر قدرةً على دعم القران كما يسمح بإمكانية الوصول إلى معلومات الأعمالء وأيضًا 
رؤية لتلك الأعمال. والأنواع الرئيسية الثلاثة لمخازن البيانات؛ هي: أسواق البيانات (DMs)‏ 
ومخازن البيانات التشغيلية (015): ومستودعات بيانات المؤسسة (8118). وفيما يلي مناقشة 
لهذه الأنواع الثلاثة من المستودعات» ثم سنناقش أيضًا بعد ذلك البيانات الوصفية. 


أسواق البيانات (0115): 


في الوقت الذي يضم فيه مستودع البيانات قواعدّ البيانات الكبيرة عبر المؤسسة بأكملهاء عادةٌ 
ما يكون سوق البيانات (221) أصغر حجمًا ويركّز أكثر على موضوع أو قسم معين. s DM à]‏ 
عبارة عن مجموعة فرعية من مستودع البيانات» تتكوّن عادةٌ من منطقة موضوع واحد فقط 
(كالتسويقء أو العمليات). وقد تكون 231 تابعةً أو مستقلةً. يكون سوق البيانات التابع عبارة 
عن مجموعة فرعية يتم إنشاؤها مباشرةٌ من مستودع البيانات. كما أن لديها مزايا استخدام نموذج 
بيانات متسق وتوفير بيانات جيدة. وتقوم أسواق البيانات التابعة بِدَعْم مفهوم نموذج بيانات 
واحد على مستوى المؤسسة بأكملها؛ ولكن يجب أولًا إنشاءُ مستودع البيانات. يضمن gW DM‏ 
للمستخدم النهائي أن يشاهد نفس الإصدار من البيانات التي يشاهدها كل المستخدمين الآخرين 
مستودع البيانات. تتسبّب التكلفة العالية مستودعات البيانات في الحَدٌ من استخدامها للشركات 
الكبيرة. فتستخدم العديدُ من الشركات بدلا من ذلك إصدارّا منخفض التكلفة ومصغرًا ممستودع 
البيانات يُعرّف على أنه سوق البيانات المستقل. يعد سوق البيانات المستقل مستودعًا صغي؟ 
مُصمَمًا لوحدة أعمال إستراتيجية؛ لکن لا يكون colo posae‏ اممشروع (۴0۷) مصدرًا له. 


مخازن البيانات التشغيلية (0105): 


يُوفر مخزن البيانات التشغيلي (025) نموذجًا Éa‏ إلى حَذَّ ما لملف معلومات العميل. 
وغالبًا ما يُستخدّم هذا النوع من قواعد البيانات كمنطقة مؤقتة لمستودعات البيانات. وبخلاف 
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المحتويات الثابتة لمستودع البيانات» يتم تحديث محتويات (025) طوال فترة العمليات 
التجارية. وتُستخدّم (055) في اتخاذ القرارات القصيرة الأجل التي تشمل التطبيقات ذات المهامٌ 
الحسّاسة بدلا من اتخاذ القرارات المتوسطة والطويلة الأجل المرتبطة ب (ODS) 443 (EDW)‏ 
الذاكرة القصيرة المدى في أنها تخرن المعلومات الحديثة فقط. وفي المقابل؛ يشبه مستودع البيانات 
الذاكرة الطويلة المدى؛ لأنه يُخزّن معلومات دائمة. يقوم 025 بدَمّْج البيانات القادمة من أنظمة 
مصادر مُتعدّدة ويوفر رؤية متكاملة تقريبًا للبيانات المتغيرة والحالية. وتتطابق عمليات تبادل 
ونقل وتنزيل (ETL)‏ - والتي ستتم مناقشتها لاحقًّا في هذا الفصل - الخاصة ,~ b ge (ODS)‏ 
العمليات المتعلقة بمستودع البيانات. وأخيرا. يتم إنشاء سوق التشغيل (انظر: 2001 (mhoff,‏ 
عند الحاجة إلى تحليل البيانات التشغيلية المتعددة الأبعاد. وتجدر الإشارة إلى أن مصدر البيانات 
الخاصة بسوق التشغيل هو نظام 0125. 


مستودعات بيانات المؤسسة (EDW)‏ 

(EDW) awh Dbk Egua A‏ مستودعً بيانات واسع النطاق يُستَخدّم لدعم القرار 
في جميع أنحاء المؤسسة. توفّْر طبيعة (8218) الواسعة النطاق تكامل البيانات القادمة من 
العديد من المصادر في شكلٍ Sali‏ لتطبيقات ذكاء الأعمال الفعّالة وتطبيقات ذَعْم القرار. يتم 
استخدامٌ (8101175) لتوفير بيانات للعديد من أنواع أنظمة دعم القرار (1055)» بما في ذلك إدارة 
علاقات العملاء (13/1©). وإدارة سلاسل التوريدات (/502). وإدارة أداء الأعمال (/2)822 
ومراقبة نشاط العملء وإدارة دورة حياة المنتتج. وإدارة الإيرادات وأحيانًا حتى أنظمة إدارة 
المعرفة. وتوضّح الحالة العملية )١1-(‏ مجموعةً متنوعةً من المزايا التي تعود إيجابيًا على شركات 
الاتصالات من جرّاء تنفيذها لحلول تحليلات البيانات المخزّنة في المستودع. 


البيانات الوصفية: 

تُعرّف البيانات الوصفية بأنها بيانات تصف بيانات (على سبيل المشال: انظر 
iog diog COBLUI es 339 (Sen, 2004; Zhao, 2005‏ بنية البيانات وبعض معانيها؛ مما 
يُسهم في استخدامها الفعّال أو غير الفعال. أشار ميهرا (0١٠٠م)‏ إلى أن عدداً قليلاً من المنظمات 
تتفمّم بالفعل طبيعة البيانات الوصفية» ويتفهم ع ددٌّ أقل من الأول لكيفية تصميم وتنفيذ 
إستراتيجية للبيانات الوصفية. ويتمْ تعريف البيانات الوصفية بشكلٍ عام؛ من حيث الاستخدام 
كبيانات وصفية تقنية أو بيانات أعمال. وَتُعَنٌ الأماط طريقةً أخرى لعرض البيانات الوصفية؛ إذ 
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هُكننا من منظور نمطي أن تُفرّق بين كلّ من البيانات الوصفية النحوية (أَيْ: البيانات التي da‏ 
بناء جملة البيانات) والبيانات الوصفية الهيكلية (أيْ: البيانات التي تَصف بنية البيانات) والبيانات 
الوصفية ذات الدلالات اللفظية (أيْ: البيانات التي تَصف معنى البيانات في مجال معين). 


حالة عملية ١-۳‏ 
خطة بيانات أفضل: تستفيد شركات الاتصالات الجيدة التأسيس من مستودعات 
البيانات والتحليلات؛ للبقاء على القمة في صناعة تنافسية 

جَنَت شركاثٌ الاتصالات - التي ساعدت على تحفيز النمو الهائل لهذه الصناعة في 
أواسط وأواخر تسعينات القرن الماضي- منذ فترة طويلة فوائد أن تكون أول سوق (أيْ: 
الريادة في هذا الحقل). ولكن للحفاظ على القدرة التنافسية؛ يجب على هذه الشركات 
تحسين كلّ شيء باستمرار بدءًا من خدمة العملاء إلى تخطيط الأسعار. وفي الواقع؛ تواجه 
شركات الاتصالات الجوالة المخضرمة العديدَ من نفس التحَدَّيات التي تواجهها الشركات 
الصاعدة. مثل: الاحتفاظ بالعملاءء وخفض التكاليف» وتحسين نماذج التسعير, ورَفْع مستوى 
رضا العملاءء واكتساب عملاء جُدد» وقَهْم دور وسائل الإعلام الاجتماعية في ولاء العملاء. 

تلعب تحليلاتٌ البيانات العالية الاستهداف دورًا أكثر أهميةٌ في مساعدة شركات 
الاتصالات الجوالة على تأمين أو تحسين مكانتها في سوق تتزايد فيه المنافسة. وفيما يلي: 
كيف يعمل بعض كبار مُزوّدي الخدمات ف العام على إنشاء مستقبل قوي قائم على 
الأعمال التجارية القوية وذكاء العملاء. 

المحافظة على العملاء: 


قد لا يخفى على أحد أن السرعة والنجاح اللذين يتعامل بهما pia‏ الخدمة مع 
طلبات الخدمة يؤثران بشكلٍ مباشر على مستوى رضا العملاءء وبالتالي ا ميل إلى التسرب. 
gibal oSI‏ هنا هو الوصول إلى العوامل التي لها أكبر الأثر. 

تدوّن روكسان جارسيا - مديرة مركز العمليات التجارية لشركة 
ó - Telefónica de Argentina‏ ملاحظاتها: «إذا تمكّنًا من تتبّع الخطوات ال متبعة مع 
jS‏ عملية؛ فيمكننا أن نفهم نقاط الفشل والتسارع. كما يمكننا قِياسٌ تدفقات العمل 
داخل الوظائف وفيما بينهاء والتنبق بمؤشرات الأداء بدلا من الاستجابة da)‏ ورفع مستوى 
الرضا العام عن تشغيل عملاء جدد». 
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كان حل الشوكة؛ هو مشروع التتبّع الذي بدأ ب ٠١‏ لوحات معلومات في عام 
۹٠م.‏ ومنذ ذلك الحين؛ حفَقّت الشركة عائدات سنوية قدرها ۲,٤‏ مليون دولار 
أمريكي ووفورات في التكاليف. وتقليص وقت اكتساب العملاء الجدد. وانخفاض في عدد 


تسرب العملاء بنسبة .79٠‏ 

تقليل التكاليف: 

يعتمد البقاءٌ على القمة في أيّ صناعة. في جزءٍ كبير منهء على الحفاظ على التكاليف 
في أدنى مستوياتها. بالنسبة لثركة .5,4JI Bouygues Telecom‏ تمّ خَفْضُ التكلفة 
بصورة آلية. يقوم 412012 - وهو نظام إدارة عمليات التسويق القائم على شركة 
تيراداتا - بنقل عمليات الإنتاج التسويقية المباشرة إلى الصورة الآلية. وقد تخَطَّت 
مدخراتها في عام واحدٍ أكثر من مليون دولار؛ في حين تضاعفت تكاليف حملة البريد 
الإلكتروني الخاصة بها وإنتاج المحتوى ثلاثة أضعاف. 

تقول كاثرين كورادو - مديرة المشروع الرائدة في مجال المبيعات ومديرة اتصالات 
التجزئة: «إِنَّ هدفنا هو أن تكون أكثر إنتاجيةٌ واستجابةٌ لتبسيط العمل الجماعي» 
ولتوحيد وحماية خبراتناء Aladin pli; Jazu‏ أعضاء الفريق يركّزون أكثر على القيمة 
المضافة للعمل؛ من خلال تقليل المهامٌ ذات القيمة المنخفضة؟ فتكون النتيجة النهائية 
المزيد من الجودة والإبداع في المخرجات». 

هناك فائدة غير مقصودة من 18ذ8120؛ ولكنها مُرخَّبٌ بها للغايةء وهي أنه تم إلهامُ 
الإدارات الأخرى بِبَدْء نَفْر مشاريع مماثلة ÍS‏ شيء بدءًا من دعم مركز الاتصال وانتهاءً 
بعمليات إطلاق المنتجات/ العروض الترويجية. 

اكتساب العملاء: 

مع اختراق السوق بنسبة *٠٠١‏ أو أكثر في العديد من الدولء وبفضل المستهلكين 
الذين يمتلكون أجهزةً متعددة؛ فإنَّ مسألة كَمْبٍ عملاء جُدُد لا تَثّل تحدياً صغيراً. كما 
Mobilink à$,5 aes‏ - أكبر شركة نقل في باكستان - صعوبة التشغيل في سوق يمتلك 
ja ZIA ò‏ ا مستخدمين خطةً مسبقة الدفع. والتي تتطلّب مشتريات منتظمة من 
الدقائق الإضافية. 

يقول عمر أفضال - كبير المديرين في بي آي: ol»‏ رفع القيمةء على وجه الخصوصء 
يحافظ على قوة وحساسية دور الإيرادات في نموٌ شركتنا؛ ففي السابق كنا نفتقرٌ إلى 
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القدرة على تعزيز هذا الجانب من النمؤٌ التدريجي. لقد منحنا نموذجنا لمعلومات 
المبيعات تلك القدرة؛ لأنها ساعدت فريق المبيعات على رَسْم خطط المبيعات القانئمة 
على الإستراتيجيات الأكثر ذكاءً والمستندة على البيانات والتي تساعدنا على تزويد مُورّدِينا 
ببطاقات ال 5124 وكروت الخدش وقدرات زيادة الرّصيد الإلكتروني بشكلٍ كامل». 
ونتيجةً لذلك؛ & 1453( sae $ olj Mobilink‏ المشتركين بنسبة 2۲ فحسب؛ بل 
زادت أيضًا من اكتساب عملاء جدد بنسبة 6* وتحسين ربحية تلك المبيعات JE Ran‏ 


شبكات التواصل الاجتماعي: 


يعمل التوسّع في استخدام شبكات التواصل الاجتماعي على تغيير عدد المنظمات 
التي تتعامل مع كلّ شيء بدءً! من خدمة العملاء مرورًا بالمبيعات وانتهاءً بالتسويق. 
ويتجه المزيدٌ من شركات الاتصالات إلى تحويل اهتمامها بالشبكات الاجتماعية؛ لفهم 
سلوك العملاء والتأثير فيه بشكلٍ أفضل. 

وقد بادرت علهذلا810 بطَرّح مشروع لتحليل الشبكات الاجتماعيةء والذي سوف 
ُن الشركة من استكشاف مفهوم التسويق الفيروسي وتحديد المؤثرين الرئيسين الذين 
يمكنهم العمل كسفراء علامة تجارية لبيع المنتجات. وتبحث 761003 عن مؤثرين 
رئيسين مشابهين إضافةً إلى عملاء منخفضي القيمة؛ إذ يكن الاستفادة من قيمتهم 
الاجتماعية لتحسين العلاقات qÀ5 dl Swisscom gílas c. 8l i85 ds XUI‏ 
جانب الشبكة الاجتماعية لسلوك العملاء مع بقية تحليلها خلال الأشهر القليلة القادمة. 

الارتفاع إلى مستوى التحَدّي: 

على الرغم من أن كلّ سوق يُقدَّم تحَدّيات فريدةً خاصةً به؛ فإِنَّ معظم شركات 
الاتصالات الجؤالة تنفق الكثير من الوقت والموارد في إنشاء ونَشْر وتدنسيق الخطط 
لمواجهة كلّ من التحَدّيات المُوضّحة هنا. والخبر السَّار هو أنه مع اتساع وتطوّر الصناعة 
وتقنية الهاتف المحمول على مر السنين؛ فإنَّ حلول تحليلات البيانات التي تم إنشاؤها 
لواجهة هذه التحَدّيات S‏ قادرةً على تلك المواجهة. 

يقوم تحليلٌ البيانات الصوتية باستخدام العملاء الحاليين» والأعمال التجارية, 
ومعلومات السوق للتنبؤ والتأثير على السلوكيات والنتائج المستقبلية. وتكون النتيجة 
النهائية؛ هي الوقوف على نَهْج أكثر ذكاءً وأكثر رشاقة وأكثر نجاحًا للحصول على حصة 
سوقية وتحسين الرّبحية. 


vm‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات الوصفية :)١(‏ ذكاء الآعمال ومستودعات البيانات 


أسئلة للمناقشة: 

-١‏ ما هي التحَدّيات الرئيسية لشركات الاتصالات؟ 

؟- كيف مكن لمستودعات البيانات وتحليلات البيانات مساعدة شركات الاتصالات 
danl ġ‏ على تحَدّياتها؟ 

-Y‏ اذا تعتقد أن شركات الاتصالات مناسبة تمامًا للاستفادة الكاملة من تحليلات البيانات؟ 
Source: Marble, C. (2013). A better data plan: Well-established TELCOSs leverage‏ 


analytics to stay on top in a competitive industry. Teradata Magazine. http://www. 


teradatamagazine.com/v13n01/Features/ A-Better-Data-Plan (accessed June 2016). 


أسئلة مراجعة على القسم Y-Y‏ 

-١‏ ما هو مستودع البيانات؟ 

۲- كيف يختلف مستودع البيانات عن قاعدة بيانات المعاملات؟ 
SODS 54 la -Y‏ 

ع- اذكر أوجه الاختلاف بين كلّ من .EDWs .ODS5 «DM‏ 


1- ما هي البيانات الوصفية؟ اشرح أهمية البيانات الوصفية. 


۳-۳ عملية مستودعات البيانات: 


تقوم المؤسساث - العامة والخاصة - بِجَمْع البيانات واممعلومات وا معرفة باستمرار بمعدل 
متزايد السرعة وتخزينها في أنظمة محوسبة. وهنا يصبح الحفاظ على هذه البيانات والمعلومات 
واستخدامها أمرًا معقدًا للغاية؛ خاصةً مع ظهور مشكلات التوسّع. إضافةً إلى ذلك؛ يستمرٌ تزايد 
عدد المستخدمين الذين يحتاجون إلى الوصول إلى العلومات Šad‏ لارتفاع مستوى المصداقية 
وسهولة الوصول إلى الشبكة. وخاصة الإنترنت. لقد أصبح العمل مع قواعد بيانات متعددة 
- سواء ذات مستودع بيانات متكامل أم لا - مهمة بالغة الصعوبة تتطلّب خبرةً كبيرةٌ؛ ولكنها 
يمكن أن توفر فوائد هائلة تنجاوز تكلفتها بكثير. وكمثال توضيحيء يعرض الشكل *-" فوائد 
الأعمال التجارية لمستودع بيانات المؤسسة (81018) التي قامت تيراداتا ببنائه لصالح شركة 
تصنيع سيارات رائدة. 
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er pa‏ دقة تقارير الأداء البيني وقرارات بشان قضايا تحسین جود بیقات 213 خفض التكلفة من خلال 

PONI aided,‏ الجودة المطالبات دمج سوق البيانات 





























Source: Tradata Corp 
اتخاذ القرارات المعتمدة على البيانات - فوائد الأعمال لمستودع البيانات‎ P-P شكل‎ 
العديدٌ من المنظمات إلى إنشاء مستودعات البيانات» أيْ: مخازن بيانات ضخمة‎ eL ze 
البيانات من مختلف الموارد الخارجية‎ Saal لبيانات السّلاسل الزمنية المتعلّقَة بدَعْم القرار. يتخ‎ 
والداخلية» ويتمّ تطهيرها وتنظيمها بطريقة تتوافق مع احتياجات المؤسسة. وبعد مَلء البيانات‎ 
في مستودع البيانات؛ يمكن تنزيل أسواق البيانات (245) لمنطقةٍ ما أو قسم معين. وبدلًا من‎ 
فغاليًا لا يتم‎ eUS gag EDW ذلك؛ يمكن إنشاء 226 أولًا - وفقًا للحاجة - ومن ثم دَمْجُها في‎ 
تطوير 21/5 وإنما يتم تنزيل البيانات ببساطة على أجهزة الحاسب الشخصية أو تركها في حالتها‎ 
الأصلية؛ من أجل معالجة بارعة مباشرةٌ باستخدام أدوات ذكاء الأعمال.‎ 
نعرض في الشكل 4-8 مفهوم مستودع البيانات. وفيما يلي المكوّنات الرئيسية لعملية مستودعات‎ 
البيانات:‎ 
مصادر البيانات: يتم الحصول على البيانات من عدَّة أنظمة تشغيلية مستقلة «قدهة» وربما‎ - 
من مُرْوٌدي البيانات الخارجيين (مثل: التعداد السكاني الأمريكي). وقد تأني البيانات أيضًا من‎ 
أو نظام تخطيط موارد المؤسسات (58180). وقد تتعَذَّى أيضًا بيانات الويب في شكل‎ )01:1( 
سجلات ويب من مستودع البيانات.‎ 
التنقيب في البيانات وتحويلها: يتم التنقيبُ في البيانات وتحويلها بشكل صحيح باستخدام‎ - 
1 ETL تجاريًا لهذا الغرض ويُسمَّى‎ daa برنامج مكتوب خصيضًا أو‎ 
تنزيل البيانات: يتم تنزيل البيانات في منطقة تدريجية؛ إذ يتم تحويلها وتطهيرها. تكون‎ - 
2245 البيانات بعد ذلك جاهزةً للتنزيل في مستودع البيانات أو في‎ 
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- قاعدة بيانات شاملة: وَتُعَدذُ بشكلٍ أساسيّ هي ee (EDW)‏ تحليل القرار بصورة شاملة؛ 
من خلال توفير معلومات ذات صلة موجزة ومُفْصّلة قادمة من العديد من المصادر المختلفة. 

- البيانات الوصفية: يتم الاحتفاظ بالبيانات الوصفية بالصورة التي تسمحٌ بتقييمها من قبل 
موظفي ومُستخدمي التقنية. وتتضمّن البيانات الوصفية برامج عن البيانات والقواعد المتعلقة 
بتنظيم ملخصات البيانات التي يَسهُل فهرستها والبحث فيها؛ خاصةً مع أدوات الويب. 

- الأدوات الوسيطة: تتيحٌ الأدوات الوسيطة الوصول إلى مستودع البيانات. ويمكن للمستخدمين 

المحترفين - كاءلحللين مثا - كتابة استعلامات 501 الخاصة بهم. هكن للآخرين توظيف بيئة 

استعلام يتم إدارتها بصورة جيدة. مثل كائنات الأعمال؛ وذلك بغرض الوصول إلى البيانات. 

هناك العديدٌ من التطبيقات ذات الواجهات الأمامية التي يكن لأصحاب الأعمال التفاعل من 

خلالها مع البيانات المخرّنة في مستودعات البيانات» بما في ذلك التنقيب في البيانات» 01۸۴ء 

أدوات إعداد التقاريء وأدوات عرض البيانات. 

| تطبيقات (تصوير) لا خيارات لسوق البيانات تا 
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شکل :٤-۳‏ إطار عمل وطرق عرض مستودع بيانات 
أسئلة مراجعة على القسم ل 
-١‏ صف عملية مستودعات البيانات. 
؟- صف المكوّنات الرئيسية لمستودع البيانات. 


a -Y‏ وناقش دور الأدوات الوسيطة. 
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٤-۳‏ بنیات مستودعات البيانات: 

54 استخدامٌ العديد من فنيات نظام المعلومات الأساسية لمستودعات البيانات. وبشكل عام 
عادةً ما تُسمَّى هذه الفنيات العميل/ الخادم أو البنية ذات عدد (ن) الطبقات؛ والتي تكون أكثرها 
شيوعًا ثنائية أو ثلاثية الطبقات (انظر الشكلين 0-Y‏ و1-8)؛ ولكن في بعض الأحيان يكون هناك طبقةٌ 
واحدةٌ فقط. ومن المعروف أنَّ هذه الأنواع من البنيات المتعددة الطبقات قادرةٌ على تلبية احتياجات 
أنظمة المعلومات الواسعة النطاقء والتى تتطلب الأداءء مثل: مس تودعات البيانات. وبالإشارة إلى 
استخدام الفنيات المتعددة الطبقات المتداولة فی مجال مستودعات البیانات؛ فإن هوفرء وبريسكوت» 
ومکفادین (۲۰۰۷) فرقوا بين هذه الفنيات من خلال تقسيم مستودع البيانات إلى ثلاثة أجزاء: 

-١‏ مستودع البيانات نفسه: والذي يحتوي على البيانات والبرامج المرتبطة به. 

-Y‏ برنامج الحصول على البيانات (النهاية الخلفية): والذي يستخرج البيانات من الأنظمة القدهة 
والمصادر الخارجية» ومن ثمَّ يقوم بدَّمْجها وتلخيصها وتنزيلها في مستودع البيانات. 

-٠‏ برنامج العميل (الواجهة الأمامية): والذي يسمح لجميع المستخدمين بالوصول إلى البيانات 
وتحليلها من المستودع (a DSS/bi/business analytics [BA] engine)‏ 
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شكل :٥-١‏ بنية مستودع البيانات ثلاثية الطبقات 
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في بنية ثلاثية الطبقات؛ تحتوي الأنظمة التش غيلية على البيانات والبرمجيات؛ لحَضْر البيانات 
في طبقة واحدة xs‏ الخادم)ء ويكون مستودعٌ البيانات في طبقة أخرى» في حين تحتوي الطبقة 
الثالثة على محرك 1255/81/84 (أيْ: خادم التطبيق) والعميل (انظر: شكل -0). تتم معالجة 
البيانات من المستودع مرتينء ويتمٌ إيداعها في قاعدة بيانات إضافية ومُتعدّدة الأبعاد. تمّ تنظيمها 
لسهولة عمل تحليل وَعَرْضِ مُتعدّد الأبعاد أو نسخها في 2205. وتتمثل مَيْرْة البنية الثلاثية في 
فصلها عن وظائف مستودع البيانات؛ مما يلغي قيود الموارد ويُسِهّل DM 5Uol‏ 

وفي بُنية من مستويين» يعمل محرك 155 فعليًا على نفس النظام الأساسي كمستودع للبيانات 
(انظر: شكل 7-7). ولذلك؛ فهي أكثر اقتصادًا من الهيكل الثلائي. ويمكن أن يكون للبنية ذات المستويين 
مشكلات في الأداء _لمستودعات البيانات الكبيرة التي تعمل مع التطبيقات الكثيفة البيانات لدعم القرار. 

يفترض جزءٌ كبيرٌ من الحكمة الشائعة اتباع نَهْج استبدادي, معتبرا أن أحد الحلول أفضل من 
الآخرء بصرف النظر عن ظروف المنظمة واحتياجاتها الفريدة. ولمزيدٍ من تعقيد هذه القرارات 
الهيكلية؛ يُركّر العديد من الاستشاريين ومُطوّرِي البرامج على eje‏ واحد من البنية؛ مما يَحِدٌ من 
قدرتهم ودافعيتهم على مساعدة المنظمة من خلال الخيارات القائمة على احتياجاتها. ولكن يتم 
التشكيك في هذه الجوانب وتحليلها. فعلى سبيل المثال: قدَّم )2005( 811 معايير اتخاذ القرار 
للمؤسسات التي تخطط لتنفيذ تطبيق ذكاء الأعمال وقد حدّد بالفعل حاجته إلى 12/9 المتعددة 
الأبعاد؛ ولكنه يحتاج إلى المساعدة في تحديد البنية المتدرجة المناسبة. وتدور معاييره حول التنبؤ 
بالاحتياجات للمساحة وسرعة الوصول (للمزيد من التفاصيل انظر: 2005 8211). 


يُكَذُ كلّ من مستودعات البيانات والإنترنت من التقنيات الرئيسة التي تقدّم حلولًا مهمةٌ 
لإدارة بيانات الشركة. sla qs oe quus‏ التقنيتين مستودعات البيانات على شبكة الإنترنت. 
ونعرض في الشكل (8-) هيكل مستودعات البيانات على الويب. إذ تتكون البنية من ثلاث 
طبقات» وتضمٌ عميل الحاسب وخادم الويب وخادم التطبيقات. على جانب العميل؛ يحتاج 
المستخدم إلى اتصال إنترنت ومتصفح ويب (يُفضّل أن يكون 1272) من خلال واجهة المستخدم 
الرسومية اللألوفة isis (GUI)‏ وسيط الاتصال بين العميل والخوادم هو الإنترنت/ الإنترانت/ 
الإكسترانت. بالنسبة للخادم؛ FT‏ م استخدامٌ خادم ويب لإدارة تدفق المعلومات الداخلة والخارجة 
بين العميل والخادم. وتكون مدعومةً من قبل کل من مستودع البيانات وخادم التطبيقات. 
كما يوفر مستودعات البيانات على شبكة الإنترنت العديد من ال مزايا الجدّابةء ما في ذلك سهولة 
الوصول واستقلالية النظام وقلة التكلفة. 
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وتتشابه فنيات الويب الخاصة بمستودعات البيانات مع الفنيات الأخرى بمستودعات البيانات» 
والتي تتطلّب اختيار تصميم لإسكان مستودع بيانات الويب مع خادم المعاملات أو كخادم 
منفصل/ خوادم منفصلة. Lys isu idg‏ الصفحات أحد الاعتبارات esas à Aaa‏ 
التطبيقات المستندة إلى الويب؛ ولذلك يجب تخطيط سعة الخادم بعناية. 





© 
صفحات الويب 
لض ا الداخلية 
مستودع االشبكة الخارجية 
البيانات 


شكل ۷-۳: بنية تخزين البيانات القائمة على الويب 





خادم التطبيق 














يجبٌ الوضع في الاعتبار العديدَ من المسائل عند تحديد أي بنية سوف يتم استخدامها. من بينها ما يلي: 
- ما هو نظام إدارة قواعد البيانات (82815) الذي ينبغي استخدامه؟ يتم إنشاء معظم 
مستودعات البيانات js ish, -RDBMS ela&c ub‏ من 0:26 من شركة أوراكل (.0:2616 
«(microsoft.com/sql) «43555 ,Ssls à $55 (y a SQL Servers (com‏ و082 من شركة 
BM (http//www-0Libm.com/software/data/db2)‏ هم الأكثر استخدامًا. يدعم ds‏ 
من هذه المنتجات كلا من العميل/ الخادم والهياكل المبنية على شبكة الإنترنت. 
- هل تتم المعالجة على التوازي أم على التوالي؟ تكن اللعالجة المتوازية العديد من وحدات 
ا معالجة المركزية dodi os (CPU)‏ طلبات استعلام مستودع البيانات آنيّا كما توفر القابلية 
للتوشّع كلما لزم الأمر. يحتاج مُصمّمو مستودع البيانات إلى تقرير ما إذا كان سيتمٌ تقسيم 
جداول قاعدة البيانات (أيْ: تقسيمها إلى جداول أصغر)؛ من أجل كفاءة الوصول» وتحديد 
المعايير التي ستّس تخدّم في المعالجة. وهذا هو الاعتبار المهمٌ الذي تقتضيه كميات كبيرة من 
البيانات الواردة في مستودع بيانات نموذجي. يمكن العثور على مَسْح حديث على مستودعات 
البيانات المتوازية والموزّعة في )2009( .Furtado‏ لقد نجحت 4$ (Teradata.com) blog‏ 
في تبَنّي هذا النهج بكفاءة, وكثيرا ما يتم التوصية به. 
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- هل سيت استخدامٌ أدوات ترحيل البيانات لتنزيل مستودع البيانات؟ إن نقل البيانات من نظام 
قائم إلى مستودع للبيانات؛ هو مهمةٌ شاقةٌ ومُضنيةٌ. واعتمادًا على تنؤّع وموقع أصول البيانات؛ 
قد تكون الهجرة إجراءً بسيطًا نسبيًا أو (على النقيض) مشروعًا يستغرق عدة أشهر. يجب 
استخدامٌ نتائج تقييم شامل لأصول البيانات الموجودة لتحديد ما إذا كان سيتمٌ استخدامٌ أدوات 
الترحيل أم لاء وإذا كانت الإجابة بنعم؛ فما هي القدرات المطلوبة في تلك الأدوات التجارية. 

- ما الأدوات التي سيتمٌ استخدامها لدعم استرجاع البيانات وتحليلها؟ في كثيرٍ من الأحيان» يكون 
من الضروري استخدام أدوات مُتخصّصة لتحديد مواقع البيانات الضرورية والوصول إليها 
وتحليلها واستخراجها وتحويلها وتنزيلها بشكلٍ دوري في مستودع البيانات؛ إذ يجب اتخاذ قرار 
بشأن اختيار أحد البدائل: -١‏ إما تطوير أدوات الترحيل داخليًاء أو ۲- شراؤها من جهة خارجية 
-Y gl‏ استخدام الأدوات المتوفرة بنظام مستودع البيانات. وتستدعي عمليات الترحيل الفورية 
والمعقدة للغاية الاستعانة بأدوات .15:11 لجهات خارجية مُتخصّصة. 


بُنيات مستودعات البيانات البديلة: 
على أعلى مستوى؛ يمكن تصنيف وجهات نظر تصميم هيكل مستودع البيانات في تصميم 

مستودع البيانات على مستوى المؤسسة (EDW)‏ وتصميم (2009 -DM (Golfarelli & Rizzi,‏ 

ونعرض $ Éa a-e (A-Y) Si‏ البدائل لأنواع التصاميم الهيكلية الأساسية التي لا تكون 

DM V ål (EDW)‏ خالصةء ولكن تتنوع بين الهياكل الفنية التقليدية أو خارجها. وتشمل 
الهياكل الجديدة البارزة كلا من ISt Shaig hub-and-spoke‏ تم اقتراح الهياكل الخمسة 

às Watson (2005, 20062,b) 5 Ariyachandra ál.ls; a-e (A-Y) JS 2I à x‏ دراسة 

سابقة مستفيضة, حَذَّد Sinha (2005)5 Sen ja QS‏ خمس عشرة منهجية مختلفة لمستودعات 

البيانات. تُصنّف مصادر هذه المنهجيات إلى ثلاث فنات عريضة: باعة التقنية الأساسية» وبائعي 

البنية التحتية. وشركات نمذحة المعلومات. 

أ- سجلات البيانات المستقلة: تكن القول: إِنَّ هذا هو أبسط البدائل الهيكلية وأقلها تكلفةًٌ. 
وقد تمَّ تطويرٌ ilizua Jaxl DMs‏ بعضها عن بعض لتلبية احتياجات الوحدات التنظيمية 
المنفردة. وبسبب استقلاليتهاء قد يكون لها تعريفات بيانات غير مُتسقة وأبعاد ومقاييس 
مختلفة؛ مما يؤدي إلى صعوبة تحليل البيانات عبر 1245 (أيّْ: إنه من الصعبء إن م يكن 
من المستحيلء الحصول على «نسخة واحدة من الحقيقة»). 
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هيكل حافلة سوق البيانات: يُعَذّ هذا الهيكل بديلًا قابلًا للتطبيق ل 2215 المستقلة؛ إذ يتم 
رَبْط الأسواق المنفردة بعضها مع بعض عن طريق نوع من الوسائط. ونظرًا لأن البيانات تكون 
مرتبطة بعضها ببعض؛ فهناك فرصةٌ أفضل للحفاظ على اتساق البيانات في جميع أنحاء المؤسسة 
(على الأقل عند مستوى البيانات الوصفية). وعلى الرغم من أن هذا الهيكل يسمح باستعلامات 
البيانات المعقدة عبر [DMs‏ فإنَّ أداء هذه الأنواع من التحليل قد لا يكون بمستوى مُرضٍ. 


يد 


Sao jal ga lio Jog hub-and-spoke Sh -x‏ لمستودعات البيانات اليوم. وهنا 


ينصبٌ الاهتمام على بناء بنية تحتية قابلة للتطوير وقابلة للصيانة (غالبًا ما يتم تطويرها 
بطريقة تكرارية» أيْ: موضوع تلو الآخر) والتي تتضمّن مستودع بيانات مركزي والعديد من 
98 (لكل وحدة تنظيمية). تسمح هذه البنية بسهولة التخصيص لواجهات المستخدم 
والتقارير. وعلى الجانب السَّلبِي؛ تفتقر هذه البنية إلى الرؤية الشاملة للمؤسسة وقد تقود 
إلى تكرار البيانات» ووقت استجابة طويل للبيانات. 


hub-and-spoke Jea go gS phl DUll gogan ISu د- مستودع البيانات المركزي: يتشابه‎ 


باستثناء أنه لا تُوجَّد 2245 تابعة؛ ويُوجَّد بدلًا منها 1:2117 عملاقًا يلبّي احتياجات جميع 
الوحدات التنظيمية. يوفّر هذا النّهج المركزي للمستخدمين إمكانية الوصول إلى جميع 
البيانات الموجودة في مستودع البيانات بدلا من حصرها في .0۷s‏ وإضافة إلى ذلك؛ فإنه 
يقلّل من كمية البيانات التي يتعيّن على الفريق الفني نقلها أو تغييرهاء وبالتالي تبسيط إدارة 
البيانات وقيادتها فنيًا. وإذا تمّ تصميمه وتنفيذه بشكلٍ صحيح؛ فإن هذا الهيكل يوفّر رؤيةٌ 
شاملةٌ في الوقت المناسب عن المشروع لأيّ شخص في أيّ وقتٍ أينما كان داخل المنظمة. 


ه- مستودع البيانات الموحّد: aii AD‏ الموحّد مثابة امتياز للقوى الطبيعية التي تفجّر أفضل 


الخطط لتطوير نظام مثالي. ويستخدم جميع الوسائل الممكنة لدمج الموارد التحليلية 
القادمة من مصادر مُتعدّدة لمقابلة الاحتياجات المتغيرة أو ظروف العمل. وبصورة أساسية؛ 
ينطوي النهج الموحّد على ذَمْج أنظمة متباينة. وفي البنية الموحدة؛ يتم تَرْك هياكل دَعْم 
القرار القائمة في مكانهاء ويتمٌ الوصول إلى البيانات من تلك المصادر كلما لزم الأمر. كما يتم 
دَعْم النهج الموحّد من قبل مُورّدِي البرامج الوسيطة الذين يقترحون الاستعلامات ال موزّعة 
والقدرات المشتركة. تقدّم هذه الأدوات القابلة للتجديد والقائمة على لغة الترميز (XML)‏ 
للمستخدمين رؤيةٌ شاملةٌ لمصادر البيانات الموزّعة: مما في ذلك مستودعات البيانات» و 
8 وابلواقع الإلكترونية والمستندات والأنظمة التشغيلية. عندما يختار المستخدم كائنات 
الاستعلام من هذا العرض؛ ويضغط زر الإرسالء تقوم الأداة بالاستعلام التلقائي عن المصادر 
edis e tl‏ إليها النتائج» ومن 9 تُقدّمها للمستخدم. وبسبب مشكلات الأداء وجودة 
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التحليلات الوصفية (*): ذكاء الأعمال ومستودعات البيانات 
البيانات؛ يتفق معظم الخبراء على أن الطرق المتبعة تعمل بشكل جيد لتكملة مستودعات 


البيانات وليس استبدالها (انظر: 2005 ,ده25ععء8). 


هباكل مستقلة لأسواق (a) Lll‏ 
ETL 2‏ 
الوصول للمستخدم أسواق بيانئت مستقلة منطقة أنظمة 
| | النهائي والتطبيقات بيلنات صغيرة / موجزة ) التدريج العصدر 


هيكل حافلة سوق البيانات مع أسواق البيانات مرتبطة الأبعاد (b)‏ 

















zi بيانات محددة الأبعاد‎ focal 
ie ومربوطة بأبعاد متطابقة‎ | 
pasas (بيانات صغيرة / موجزة)‎ 








) بيانات موجزة / صغيرة بعض الشئ‎ ١ 


صبكل مستودع البيانات المركزي (d)‏ 








كيت 
١‏ بيانات صغيرة / موجزة منطقة أنظمة 
I‏ بعض الشئ) التدريج المصدر 











التكامل المنطقي / المادي مستودع البيانات الحالية 
i z i‏ لعناصر البيانات المشتركة أسواق البيانات والأنظمة القديمة 














شكل -6: هياكل بديلة لمستودع البيانات 
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ds‏ ۲۰۰۵ حدّد کل 4e Watsons Ariyachandra (ya‏ ,8 عوامل من ال محتمل أن تؤٹثر على 
قرار اختيار الهيكل المستخدّم: 
-١‏ ترابط المعلومات بين الوحدات التنظيمية. 
۲- احتياجات معلومات الإدارة العليا. 
- الضرورة الملحّة لمستودع البيانات. 
- طبيعة مهامٌ المستخدم النهائي. 
ه- القيود على الموارد. 
-١‏ عَرْض إستراتيجي ممخزن البيانات قبل التنفيذ. 
۷- التوافق مع الأنظمة الحالية. 
8- القدرة الملموسة لفريق عمل تقنية المعلومات الداخلي. 
9- المشكلات الفنية. 
-٠‏ العوامل الاجتماعية/ السياسية. 

وتتشابه هذه العوامل مع العديد من عوامل النجاح الموصوفة في الأدبيات الخاصة بمشاريع 
نظم المعلومات ومشروعات 255 وذكاء الأعمال؛ إذ تُعَدُ المسائل الفنية - بخلاف توفير التقنية التي 
تكون عمليًا جاهزةٌ للامتخدام - أمرًا مهمً؛ ولكنها غالبًا لا تكون مهمةء مثل المشكلات السلوكية, 
مثل: تلبية احتياجات المعلومات الخاصة بالإدارة العلياء ومشاركة المستخدمين في عملية التطوير 
(عامل اجتماعي/ سياسي). ولكلّ هيكل من هياكل مستودعات البيانات تطبيقات خاصة به متفاوتة 
الفاعليةء وبالتالي؛ توفر فوائد قصوى للمنظمة. ومع ذلك يبدو بشكلٍ عام أن DM Saa‏ هو الأقل 
فعالية في الاستخدام. وللمزيد من التفاصيل الإضافية -Watson (20062) 9 Ariyachandra : J;l‏ 


أي البُبيات هي الأفضل؟ 

منذ أن أصبحت مستودعات البيانات حزءًا مهمًا من المؤسسات الحديثة: بات السؤال عن بنية 
مستودع البيانات الأفضل؛ هو موضوع المناقشة الدائمة. ويترّعُم هذه المناقشات اثنان من زعماء 
مجال مستودعات البيانات. هما: همحهمة للذظ ĞI .Ralph Kimball‏ ما äs ġe Inmon gòls‏ 
spoke-and-طuط‏ (مثل: مصنع ال معلومات ابلؤسسية)» في حين يروج آلهطدن1 لحافلة هيكل 224 ذات 
الأبعاد المطابقة. وهناك هياكلٌ أخرى ممكنة؛ ولكن هذان الخياران هما نهجان مختلفان جوهريًه ولكل 
منهما مناصرون أقوياء. ولإلقاء الضوء على هذا السؤال المثير للجدل. أجرى Ariyachandra ja ds‏ 
و(20062) 1080502 دراسةً تجريبيةً. ولجمع البيانات قاما بإجراء استطلاع على الويب استهدفا فيه 
vet‏ ذكاء الأعمال والتحليلات وعلم البيانات. منظور إداري 


التحليلات الوصفية :)١(‏ ذكاء الآعمال ومستودعات البيانات 


الأفراد المشاركين في عمليات تنفيذ مستودع البيانات. تضمّن الاستطلاعٌ أسئلةً شخصيةً عن القائم 
بالإجابة عنه» وعن شركتهء ومستودع بيانات الشركةء ومدى نجاح هيكل مستودع البيانات. 


EOE PiS Slao‏ من المجيبين معلوماتٍ LB‏ للاستخدام. وتراوحت الشركاثٌ التي تم 
استطلاعها من صغيرة (ذات عائد أقل من ٠١‏ مليون دولار) إلى كبيرة (ذات عائدات تزيد على 
٠‏ مليار دولار). كانت معظم الشركات موجودةٌ في الولايات المتحدة بنسبة بلغت (750) 
ومثلت مجموعةً متنوعةً من الصناعاتء وش كلت صناعة الخدمات المالية معظم الاستجابات 
بنسبة بلغت (10خ). كانت البنية lgd (X4) iuu hub-and-spoke ås gya Glad‏ 
بنية الحافلة »)۲١(‏ ثم البنية ا مركزية QW) à aaa‏ ثم ANY) iaig Jätab DMs JK‏ 
sls‏ في ابمرتبة الأخيرة الهيكل المتحد بنسبة (6*). وكان النظام الأساسي الأكثر شيوعًا لاستضافة 
مستودعات البيانات هو ©0181 بنسبة »)”51١(‏ تليها مايكروسوفت (Microsoft)‏ 45 (7219), 
ثم 1814 بنسبة (1”). وتراوح معدل (متوسط) الدخل الإجمالي من ۲۷ مليار دولار أمريكي 
ل 225 المستقلة إلى t‏ مليار دولار للهيكل المتحد. وقد استخدموا أربعة مقاييس لتقييم 
نجاح الهياكل: )١(‏ جودة المعلومات, )١(‏ جودة النظام. (7) التأثيرات الفردية» و(6) التأثيرات 
التنظيمية. واستخدمت الأسئلة مقياسًا من V‏ نقاط؛ إذ تشيرٌ الدرجة الأعلى إلى بنية أكثر نجاحًا. 
يُوَضّح الجدول ١-+‏ متوسط نتائج اللقاييس لهياكل مستودعات البيانات. 





























DMs‏ هيكل hub- JS‏ الهيكل المركزي الهيكل 

المستقلة | الحافلة | (DMs Jie xax V)| and-spoke‏ | المتحد 

£N 0,۳ 0,1 011 £,£Y جودة المعلومات‎ 

جودة النظام £40 ,0 0,01 01 £41 

0,01 KA) or oA | 0,۸ التأثيرات الفردية‎ 

التأثيرات eW 0, o,f o,f | 6,775 | iah‏ 
وكما تشيرٌ نائج الدراسة؛ سجّلت 2345 المستقلة أدنى الدرجات على جميع المقاييس. وتؤكّد 





هذه النتيجة على الحكمة التقليدية التي تقول بضعف الحلّ الهيكلي المُقدّم من 2215 المستقلة. 
وجاء الهيكل الموحّد في المركز قبل الأخير. وتمتلك الشركات في بعض الأحيان منضَّات دعم قرارات 
متباينة ناتجة عن عمليات الاندماج فيما بين الشركات. وقد تختار الطريقة المتحدة. على الأقل 
على المدى القصير؛ إذ تشيرٌ النتائج إلى أنَّ الحلّ المقدّم من الهيكل المتحد ليس هو الأمثل على 
المدى الطويل. لكن الشيء المثير للاهتمام هو التشابه في المتوسطات بالنسبة لكل من الحافلة 
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وعاهمة-4هه-طتاط والهياكل المركزية. وتكون الاختلافات صغيرة ها فيه الكفاية؛ بحيث لا يمكن 
تقديمٌ أيّ مطالبات لتفوق هيكل معين على الهياكل الأخرى» على الأقل استنادًا إلى مقارنة بسيطة 
بين هذه المقاييس للنجاح. كما قاموا بِجَمْع بيانات عن النطاق (والتي يتراوح من وحدة فرعية 
إلى نطاق الشركة) وحجم (أَيْ: كمية البيانات المخزّنة) المستودعات. 

كما وجدوا أن 4,3 hub-and-spoke‏ تُستخدّم Sale‏ مع تطبيقات أكثر على مستوى اللؤسسة 
ومستودعات أكبر. وقاموا أيضًّا بالتحقيق في التكلفة والوقت اللازمين لتنفيذ الهياكل المختلفة. 
بشكل عام؛ كانت بنية ©01م200-5-طناط هي الأكثر تكلفةً واستهلاكًا للوقت لتنفيذها. 


أسئلة مراجعة على القسم *-6: 

-١‏ ما هي أوجه التشابه والاختلاف الرئيسية بين هيكلٍ من طبقتين» وهيكل ثلاني الطبقات؟ 

؟- كيف أثر الويبٌ على تصميم مستودع البيانات؟ 

۴- اذكر هياكل مستودعات البيانات البديلة التي تمت مناقشتها في هذا القسم. 

ع- ماهي المسائل الواجب أخذها في الاعتبار عند تحديد البنية التي سئس تَخدَّم في تطوير 
مستودع البيانات؟ اذكر أهمّ ٠١‏ عوامل. 

isl -‏ من هياكل مستودعات البيانات هو الأفضل؟ وماذا؟ 


(ETL) تكامل البيانات وعمليات الاستخراج والتحويل والتنزيل‎ ٥-٣ 

إن الضغوط التنافسية العامميةء والطلب على عائد (RON jY‏ والإدارة والاستفسار عن 
المستثمرين واللوائح الحكومية؛ كل هذه الأمور تجبر مديري الشركات على إعادة التفكير في كيفية 
دمج وإدارة أعمالهم. وعادةً ما يحتاج صانعٌ القرار أن يصل إلى مصادر متعددة للبيانات» والتي 
يجب أن تكون متكاملةً. وقد كانت عمليةٌ الوصول إلى مصادر البيانات عمليةً شاقةٌ وكبيرةٌ؛ وذلك 
قبل مستودعات البيانات» و10215: وبرمجيات ذكاء الأعمال. وحتى مع أدوات إدارة البيانات 
الحديثة والتي تعتمدٌ على شبكة الإنترنت؛ فإن التعرّف على البيانات التي يمكن الوصول إليها 
وتقديمها إلى صانع القرار هي مهمةٌ غير ضرورية: غير أنها تتطلب متخصصين في قواعد البيانات 
Ë gag‏ حجم مستودعات البيانات تزداد مشكلات دمج البيانات هي الأخرى. 

إنَّ تحليل الأعمال يحتاج إلى تطؤر مستمر؛ إذ يكن لعمليات الاندماج والاستحواذ والمتطلبات 
التنظيمية وإدخال قنوات جديدة أن تؤدي إلى تغييرات في متطلبات ذكاء الأعمال. وإضافةً إلى 
البيانات التاريخية والمنظفة والموحّدة والمتحصّل عليها في الوقت المناسب؛ فإنَّ مُستخدمي الأعمال 
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يحرصون على الوصول إلى البيانات غير المهيكلة à‏ الوقت المناسب m‏ تأخير. ويجبٌ أن يتكامل 
sg js‏ مع محتويات مستودع البيانات الموجود. E‏ ^" ذلك؛ أ صبح الوصولٌ عبر أجهزة 
المساعد الرقمي الشخصي JX& (355 (PDA)‏ التعرّف على الكلام والتوليف أكثر شيوعًا؛ مما يزيد 
من تعقيد قضايا التكامل (2003 ,80:8543). وتتضَّمّن العديدٌ من مشاريع التكامل أنظمة على 
مستوى المؤسسة. وقد Orovic p35‏ 3 ۰۰۳م قَائَةٌ مرجعيةٌ بما يصلح وما لا يصلح عند محاولة 
القيام بمشروع من هذا القبيل. ومن الصعب دَمْجٌ البيانات التي تأت من قواعد بيانات مختلفة 
وغيرها من المصادر اللتباينة؛ خاصةً عندما لا يتمٌ ذلك بشكل صحيح؛ إذ إنه من الممكن أن يؤدي 
إلى كارثة في أنظمة واسعة النطاق مثل ERP: CRM‏ ومشاريع سلاسل التوريد (2002 ,تلقهك). 
تكامل البيانات: 

يشتملٌ تكاملٌ البيانات على ثلاث عمليات رئيسية؛ هذه العمليات عندما يتم تنفيذها بشكل 
صحيح؛ فإنها تسمح بالوصول إلى البيانات وإتاحتها مجموعة من .811 وأدوات التحليلء وبيئة 
مستودعات البيانات» وهذه العمليات هي: الوصول إلى البيانات: وتعني القدرة على الوصول 
إلى البيانات واستخراجها من أي مصدر بيانات» اتحاد البيانات؛ أيّ: تضمين آراء الأعمال في مخزن 
البيانات المتعددة, تغيير الالتقاط؛ والذي يتم بناءَ على تحديد التغييرات التي ت تمّ إدخالها على 
مصادر بيانات المؤسسة. انظر الحالة العملية ؟-؟ للاطلاع على مثالٍ لكيفية الاستفادة من BP‏ 
à Lubricant‏ تنفيذ مستودع بيانات يدمج البيانات من عدة مصادر. فقد قام بعص المورّدين» 
مثل 12 ,6]نا]ناده1 545 بتطوير أدوات تكامل البيانات بشكل قوي. ويتضمّن مشروع تكامل 
البيانات 545 للمؤسسة أدوات تكامل بيانات العملاء التي تعمل على تحسين جودة البيانات في 
عملية التكامل. Lá f Oracle Business Intelligence Suite asclas LS‏ علی تکامل البیانات. 

ويتمثل الغرض الرئيسي من مستودع البيانات في دَمْح البيانات من أنظمة مُتعدّدة؛ بحيث 
تتيح تقنيات التكامل المختلفة دمج البيانات والبيانات الوصفية: 
- تكامل تطبيقات المؤسسات (EAI)‏ 
- العمارة الموجهة نحو الخدمة (504). 
- تكامل معلومات المؤسسة (EI)‏ 
- الاستخراج والتحويل والتحميل (۴۲1). 

$a‏ تكاملٌ تطبيقات المؤسسات (881) وسيلة لدفع البيانات من أنظمة المصدر إلى مستودع 
البيانات. وهو ينطوي على دَمْجٍ وظائف التطبيقات ويركّز على مشاركة الوظائف (بدلًا من 
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البيانات) عبر الأنظمة» وبالتالي تمكين المرونة وإعادة الاستخدام. وعلى نحو تقليدي؛ فقد رگزت 
حلول تكامل تطبيقات المؤسسات (841) على تمكين إعادة استخدام التطبيق على مستوى واجهة 
برمجة التطبيقات. وفي الآونة الأخيرة؛ يتم إنجاز تكامل تطبيقات المؤسسات (841) باستخدام 
خدمات (504) (والتي هي مجموعة من العمليات أو المهام التجارية) التي تم تعريفها وتوثيقها 
بشكل جيد. وَيُعَدَ استخدام خدمات شبكة الإنترنت طريقةً مُتخصّصةً لتنفيذ (504). كما يكن 
استخدامٌ (841) لتسهيل الحصول على البيانات مباشرةً في مستودع بيانات شبه فوري أو لتوصيل 
القرارات إلى أنظمة 01:12: وهناك العديدٌ من الطرق والأدوات المختلفة لتنفيذ (۴۸1). 

ويُّعَدُ تكامل معلومات المؤسسات (811) مجالًا جيدًا باعتباره أداةٌ متطورةٌ تقومٌ gla‏ 
البيانات الواردة من مجموعة متنوعة من المصادر في الوقت اللُحدّد مثل: قواعد البيانات 
اطمترابطةء وخدمات شبكة الإنترزنت» وقواعد البيانات المتعددة الأبعاد؛ بالإضافة إلى كونه AI‏ 
لسَحُب البيانات من أنظمة المصدر لتلبية طلب الحصول على المعلومات. وتستخدم أدوات (EI)‏ 
بيانات التعريف المعرّفة مسبقًا لتجميع وجهات النظر التي تجعل البيانات المدمجة (المتكاملة) 
تبدو مرتبطة بالمستخدمين النهائيين» وقد يكون .7211 هو الجانب الأكثر أهميةٌ في 1:11؛ وذلك لأن 
1 يسمح بِوَضْع علامات على البيانات إما في وقت الإنشاء أو في وقت لاحق» وهذه العلامات 
يمكن توسيعها وتعديلها بما يسمح باستيعاب أي مساحة من المعرفة (انظر: 2005 .(Kay,‏ 

ولطاما كان تكامل البيانات المادية؛ هو الآلية الرئيسة لصُنْعَ نظرة متكاملة مع مستودعات 
البيانات و2245. ومع ظهور أدوات تكامل معلومات المؤسسة (811) (انظر: 2005 :(ه16)؛ ol‏ 
أنماط تكامل البيانات الافتراضية الجديدة أصبحت Ía‏ وقابلةً للتطبيق, وقد ناقش كلّ من 
Mehra (2005)s Manglik‏ 3153 4 25,55 أنماط تكامل البيانات الجديدة التي يمكن أن توشع 
المنهجيات المادية التقليدية لتقديم رؤية شاملة للمشروع. 


حالة عملية Y-Y‏ 
بريتش BP eso jo‏ مواد التشحيم تحقق نجاح 18185 
قامت شركة بريتش بتروليوم لزيوت التشحيم بتأسيس برنامج 13185 لمتابعة نشاط 
الدّمج الأخير لتوفير معلومات إدارة متسقة وشفافة على مستوى العالم؛ إضافةٌ إلى تقديم 
ذكاء الأعمالء و8185 في الوقت المناسب والذي يوفر عرضًا تفصيليًا ومتكاملًا للآداء عبر 
وظائفء مثل: gaill‏ والتسويق والمبيعات. والإمدادات وخدمات التخطيط والتنفيذ. 


vo.‏ ذكاء الأعمال والتحليلات وعلم البيانات. منظور إداري 
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Ass‏ 8 واحدةً من أكبر مجموعات النفط والبتروكيماويات في العام؛ إذ تُعَنُ جزءًا 
من مجموعة عام 85؛ فشركة 88 للواد التشحيم هي شركةٌ رائدةٌ في سوق السيارات 
العامية» وتشتهر الشركة بعلامة زيوت كاسترول âs yla (Castrol)‏ كما تعمل في أكثر 
من مائة دولة ولديها عشرة آلاف موظف. ومن الناحية الإستراتيجية؛ فإِنَّ شركة BP‏ 
مواد التشحيم تركّز على تحسين خدمة عملائها. وزيادة فاعليتها في أسواق السيارات. 
وفي أعقاب نشاط الاندماج مؤخرًا تمر الشركة بعملية تحؤل لتصبح أكثر فاعليةً ومرونةً, 
واغتناماً لفرص النمو السريع. 

EXCESS 

عقب نشاط الاندماج الأخير أرادت شركة 87 للواد التشحيم تحسينّ الاتساق 
والشغفافيةء وسهولة الحصول على معلومات الإدارة وذكاء الأعمال. وللقيام بذلك كان 
من الضروري دَمْج البيانات المُحتفّظ بها في أنظمة مصدر معدل التوزيع دون التأخير في 
إدخال نظام مُوخَّد لتخطيط موارد المؤسسات. 

الحل: 

نفدت شركة 8 يواد التشحيم برنامج «ذكاء الأعمال التجارية والمعابير العالمية» 
(8185)» وهي مبادرةٌ إستراتيجيةٌ لإدارة وذكاء الأعمالء s‏ لَب برنامج 8185 يُوجَد ما يُسِمّى 
EDW J> 525 Kalido‏ التكيّفي لإعداد وتنفيذ وتشغيل وإدارة مستودعات البيانات. 

FW de qa ds‏ المتكامل من 40ذلة>1 في دَعُم تكامل البيانات المعقدة للبرنامج 
التجريبي ومتطلبات تقديم التقارير المتنوعة. وللتكيّ ف مع متطلبات إعداد التقارير 
المتطؤرة للبرنامج؛ فقد تمن البرنامج أيضًا من تعديل بنية المعلومات الأساسية بسهولة 
عالية مع الحفاظ على جميع المعلومات؛ إذ يقوم النظام بِدَمْج وتخزين المعلومات من 
أنظمة مصادر متعددة لتوفير طرق عرض مُوحّدة من أجل: 

- تسويق العائدات والهوامش الخاصة بالعميل بالنسبة لقطاعات السوق مع 
التعمق في تفاصيل مستوى الصوت. 

- زيادة التقارير الخاصة بفواتير المبيعات والتكاليف الجمركية التفصيلية والرواتب الفعلية. 

- تقديم بيانات الأرباح والخسائر والميزانية العمومية وبيانات التدفق النقدي 
الموحّدة على الصعيد العالمي. مع التدقيق في مراجعة حسابات العملاء والديون 
وخدمات التخطيط والتنفيذ؛ بحيث يتم معالجة الحركة وَعَرْضها من خلال نظام موحّد 
ERP Glais ze‏ متعددة في نظام تخطيط موارد المؤسسات. 
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الفوائد: 

iss‏ 5هذ8 المعلومات اللازمة لمساعدة الأعمال التجارية على تحديد عددٍ وافر من 
الفرص التجارية؛ من خلال تحسين رؤية البيانات المتسقة في الوقت المناسب؟ من أجل 
تحقيق أقصى قدرٍ من فرص العمل لزيادة الهوامش أو إدارة التكاليف المرتبطة بها. 

وتتضمّن الاستجابات النموذجية لفوائد البيانات المتسقة الناتجة عن 8185 ما يلي: 

- تحسين التناسق والشفافية في بيانات الأعمال. 

- إعداد تقارير أسهل وأسرع وأكثر مرونة. 

- التوافق بين المعايير العالمية والمحلية على حَدّ سواء. 

- دورة تنفيذ سريعة وفعّالة؛ من حيث التكلفة بالإضافة إلى مرونتها. 

- أقل قدرٍ من الاضطراب للعمليات التجارية القائمة والأعمال اليومية. 

- تحديد مشكلات جودة البيانات والتشجيع على dal‏ 

- تحسين القدرة على الاستجابة بذكاء للفرص التجارية الجديدة. 

أستلة للمناقشة: 

-١‏ ما هو 8185؟ 

۲- ما هي التحَدَّيات. وما هو الحل المقترح والنتائج التي تم الحصول عليها مع 8185؟ 
Sources: Kalido. BP Lubricants. http://kalido.com/download/BP-Lubricants.pdf‏ 


(accessed July 2016); BP Lubricants, www.bp.com/en/global/corporate/about-bp/ 
bp-at-a-glance.html (accessed July 2016). 


الاستخراج» والتحويل» والتحميل: 

يتضمّن الجانبٌ التقني من عملية مستودعات البيانات استخراج وتحويل وتحميل (۴11). 
وتقوم تقنية (11) - والتي كانت موجودةً منذ فترة قصيرة - بدور رئيس في العملية واستخدام 
مستودعات البيانات. وَتُعَدَُ عملية استخراج وتحويل وتنزيل البيانات (:811) عنصراً أساسياً في أي 
مشروع بيانات مركزية. وغالبًا ما يواجه مديرو تقنية ا معلومات تَحَدّيات؛ لأن عملية استخراج 
وتحويل وتنزيل البيانات عادةً ما تستهلك ۷٠‏ من الوقت في مشروع بيانات مركزية. 
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تتكوّن عملية /8:11) من: الاستخراج (ويعني: قراءة البيانات من قاعدة بيانات واحدة أو أكثر» 
والتحويل (أيْ: تحويل البيانات الممُستَخرّجة من شكلها السابق إلى الشكل الذي تحتاج إليه؛ بحيث 
يمكن وضعه في مستودع بيانات أو ببساطة قاعدة بيانات أخرى)؛ إضافةً إلى التنزيل (أيْ: وَضْعَ البيانات 
في مستودع البيانات). ويحدث التحويل باستخدام القواعد أو جداول البحث أو عن طريق دمج 
البيانات ببيانات أخرى. ويتم ea‏ وظائف قواعد البيانات الثلاثة في أداة واحدة لسحب البيانات 
من واحدة أو أكثر من قواعد البيانات» ووَضعها في قاعدة بيانات أخرى مُوخّدةء أو مستودع بيانات. 

وتقوم أدوات (8:11) أيضًّا بنقل البيانات بين المصادر والأهداف وتوثيق كيفية تغيّر عناص 
البيانات (كالبيانات الوصفية) في أثناء انتقالها بين المصدر والهدف؛ إضافةً إلى تبادل البيانات الوصفية 
مع التطبيقات الأخرى حسب الحاجة: وإدارة جميع عمليات التشغيل والعمليات الأخرى (مثل: 
الجدولة. وإدارة الأخطاء وسجلات التدقيق, والإحصائيات). Alè $ Éles (ETL) ilas i $g‏ 
الأهمية لتكامل البيانات» وكذلك لمستودعات البيانات. والغرض من هذه العمليةء هو تنزيل 
المستودع ببيانات مُدمَجة ومنتقاة. ومن الممكن أن تأي البيانات adea‏ فی عملیات(۴۲1) من 
(gl‏ مصدر ک تطبيق حاسب مركزيء أو تطبيق (88:9) أو أداة 0204 أو ملف ثابت» أو جدول 
Excel oble‏ أو حتى قائمة انتظار رسائل. وفي الشكل -؟ نحَدَّد الخطوط العريضة لعملية ELT)‏ 














نظام قديم 








داخلية أخري 




















شكل 4-8: عمليات .1711 
وتنطوي عملية ترحيل البيانات إلى مستودع البيانات على التنقيب في البيانات من جميع 
المصادر ذات الصّلة. وقد تتكوّن مصادر البيانات من ملفات مُس تخلصَّة من قواعد بيانات 
OLTP‏ وجداول البيانات. وقواعد البيانات الشخصية (على سبيل اJlkh: «(Microsoft Access‏ 
أو الملفات الخارجية. وعادةً ما e3‏ كتابة كافة ملفات الإدخال في مجموعة من الجداول المؤقتة, 
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والتي يتم تصميمها من أجل تسهيل عملية التنزيل. ويحتوي مستودع البيانات على العديد 
من قواعد العمل التي تحَدَّد أشياءء مثل: كيفية استخدام البيانات» وقواعد التلخيص» وتوحيد 
السّمات المشفرة» وقواعد الحساب. ويجب تصحيح البيانات المتعَلّقة بملفات المصدر قبل تنزيلها 
في مستودع البيانات. ومن فوائد مستودع البيانات المصمّم تصميمًا حيدًا هو أن هذه القواعد 
يمكن تخزينها في مستودع البيانات الوصفية» وتطبيقها على مستودع البيانات بشكلٍ مركزي. 
وهذا يختلف عن طريقة 011۶ التي تحتوي عادةً على قواعد البيانات والأعمال التجارية 
المنتشرة في جميع أنحاء النظام. ويمكن إجراء عملية تنزيل البيانات في مستودع البيانات إِمَّا من 
خلال أدوات تحويل البيانات التي توفر واجهة مُستخدم رسومية للمساعدة في تطوير وصيانة 
قواعد الأعمال التجاريةء أو من خلال طرق أكثر تقليدية» مثل تطوير البرامج أو الأدوات المساعدة 
لتنزيل مستودع البيانات؛ وذلك باستخدام لغات البرمجة, 3l PLISQL UJ :Ji‏ 40+ أو 
Framework cà c5» 5l Java‏ وهذا القرار لیس سهلا بالنسبة للمنظمات؛ إذ تؤثر العديدٌ 
من المشكلات على قرار المؤسسة بشراء أدوات تحويل البيانات» أو إنشاء عملية التحويل نفسهاء 
وتتمثل هذه المشكلات في: 
- أدوات تحويل البيانات الغالية الثمن. 
- قد يكون لأدوات تحويل البيانات منحنى تعلّم طويل. 
- من الصعب قياس أداء منظمة تقنية المعلومات؛ حتى تتعلّم المنظمة استخدام أدوات تحويل البيانات. 

وعلى المدى الطويل؛ ينبغي تبسيط نهج صيانة أداة تحويل مستودع البيانات للمنظمة. ومن 
الممكن أن تكون أدوات التحويل Lái‏ فعّالة في الكشف والتنظيف (معنى إزالة أية حالات شاذة 
في البيانات). وتعتمد 0147 وأدوات التنقيب في البيانات على مدى جودة تحويل البيانات. 

وكمثالٍ على RAI (ETL)‏ فإن شركة 10 ,21010012 تستخدم (1:11) لتغذية مستودعات 
البيانات الخاصة بها؛ إذ تقوم Motorola å Spå‏ بتجميع المعلومات من ثلاثين نظامًا مختلقًا 
للمشتريات. ومن ثم تقوم بإرسالها إلى مستودع بيانات blo SCM‏ لتحليل إجمالي إنفاق 
الشركة. (انظر: 2004 (Songini,‏ 

وقد E۲1 otaa Solomon (2005) cà Lo‏ إلى أربع فئات» وهي: متطورة وممكنة 
وبسيطةء وبدائية. ومن المسلم به Bgas‏ أن أدوات الفئة المتطورة ستؤدي إلى توثيق عملية 
"er ETL‏ أفضل وأكثر pos ga do‏ مشروع مستودع البيانات. 
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وعلى الرغم من أنه من الممكن للمبرمجين تطوير برنامج من أجل .811؛ فإنه من الأسهل 
استخدام أداة ,8:11 القائمة (الموجودة بالفعل). ونعرض فيما يلي لبعض المعايير المهمة في اختيار 
أداة :8:11 (Brown, 2004 : Jil)‏ 
- القدرة على القراءة والكتابة إلى عدد غير محدود من أساليب بناء مصادر البيانات. 
- التقاط تلقائي للبيانات الوصفية وتسليمها. 
- تاريخ المطابقة للمعايير المفتوحة. 
- واجهة سهلة الاستخدام للمطوّر والمستخدم الوظيفي. 

قد يكون أداء .1111 الشامل علامةً على سوء إدارة البيانات» ونقص أساسي في إستراتيجية إدارة 
بيانات متماسكة. وقد أشار (2006) رمءءةهK‏ إلى وجود علاقة مباشرة بين حجم البيانات المتكررة 
وعدد عمليات .811. فعندما يتم إدارة البيانات بشكلٍ صحيح كأصل بلؤسسآ؛ فإن جهود .7:11 
تنخفض بشكل كبي كما يتم التخلّص من البيانات المتكررة بالكامل. مما يؤدي إلى توفير كبير في 
الصيانة وزيادة الكفاءة في التطوير الجديد مع تحسين جودة البيانات. إِنَّ سوء تصميم عمليات 
1 يجعل تكلفة صيانتها وتغييرها وتحديثها باهظة. وبناءً على ذلك؛ فإنه من الأهمية بمكان 
اتخاذ الخيارات المناسبة من حيث التقنية والأدوات لاستخدامها في تطوير وصيانة عملية ,آ8:1. 

ويتوفر عددُ من أدوات ,811 المجمّعة؛ إذ يقوم مُوردو قواعد البيانات lb‏ بتوفير 
قدرات 8۲1 التي تعمل على تحسين ETL colgol‏ المستقلة والتنافس معها. وتقرٌ 545 
بأهمية جودة البيانات وتقدّم أول حل متكام ل تمامًا في هذه الصناعة يدمج :28811 
وبيانات نوعية لتحويل البيانات إلى قيمة الأصول الإستراتيجية» ومن بين مُزؤدي برامج 
811 الآخرين شركات Jnformaticag IBMs .Oracles (Microsoft) C35 155, Sols‏ 
Golfarelli : a3! ETL Ja» 4,3L2] CL eslza (de Js Laxls .Tibcos .Embarcaderos‏ 3 
-Songini (2004) 9 .Karacsony (2006) «Rizzi (2009)‏ 


:0-Y e adl أسئلة مراجعة‎ 

-١‏ صف تكامل البيانات. 

.811: صف الخطوات الثلاث لعملية‎ -Y 

*- بلاذا تُعَنُ عملية .58:15 مهمةً جدًّا لجهود مستودعات البيانات؟ 
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7-7 تطويرٌ مستودع البيانات: 
dad‏ مشروع مستودعات البيانات مهمة كبيرةً aga (S‏ وهو أكثرٌ تعقيدًا من مشروع 

اختيار وتنفيذ حاسب مركزي بسيط؛ نظرًا لأنه يضم العديدَ من الأقسام والعديد من واجهات 
الإدخال والإخراج بالإضافة إلى تأثيره عليهاء كما أنه من الممكن أن يكون جزءً! من إستراتيجية عمل 
. ويوفْر مستودعٌ البيانات العديدّ dol oa‏ والتي يمكن تصنيفها إلى مزايا مباشرة ومزايا 
غير مباشرة. وتتضمّن المزليا المباشرة ما يلي: i‏ 
E‏ يمكن للمستخدمين النهائيين إجراءً تحليل مستفيض db‏ متعددة. 
- تكن توحيدٌ وجهات النظر فيما يتعلّق ببيانات الشركة (أَيْ: إصدار صيغة واحدة للحقيقة). 
S$ -‏ الحصولٌ على معلومات أفضل وفي الوقت المناسب؛ إذ يسمحٌ مستودع البيانات بمعالجة 

المعلومات؟ ليتمٌ إعفاؤها من أنظمة التشغيل المكلّفة إلى خوادم منخفضة التكلفة. ولذلك؛ فإنه 

من الممكن معالجة الكثير من طلبات الحصول على معلومات للمستخدم الأخير بسرعة أكبر. 
- يكن أن يؤدي إلى مستوى أداء أفضل؛ إذ يُحرّر مستودع البيانات عملية الإنتاج؛ نظرًا لأن بعض 

متطلبات تقارير نظام التشغيل يتم نقلها إلى 255. 
- تبسيط الوصول إلى البيانات. 

وتنشا المزايا غير المباشرة نتيجةٌ لاستخدام المستخدمين النهائيين للمزايا المباشرة. وبشكل عام؛ 

فإِنَّ هذه المزايا تَعَرّرْ المعرفة بالأعمال التجارية» وتقدّم فائدةً تنافسية؛ إضافةٌ إلى تحسين خدمة 
العملاء وإرضائهم» كما أنها تُسهّل اتخاذ القرار. وتساعد في إصلاح العمليات التجارية. وبالتالي؛ فإِن 
مستودعات البيانات سهم بشكل قوي لإضفاء مير تنفية لمات Parzinger & Frolick,)‏ 
1)) وللاطلاع على مناقشة مَفْصّلة حول كيفية حصول المؤسسات على مستويات استشنائية من 
Dhs -Wixom (2002) ; Goodhues Watson : Jil «eL. jl‏ للفوائد ا محتمَلة التي كن أن 
يوفرها مستودع البيانات والاستثمارات الكبيرة في الوقت والمال التي يتطلبها هذا المشروع؛ فإنه 
من الأهمية بمكان أن تقوم المؤسسة بتنظيم مشروع مستودع بياناتها لتحقيق أقصى قدرٍ من فرص 
النجاح. وإضافةً إلى ذلك يجبٌ على المؤسسة بطبيعة الحال أن تأخذ في الاعتبار التكاليف. وقد 
وَصَف (2001) تإلاعك1 منهج عائد الاستثمار (201) والذي يأخذ في الاعتبار مزايا فئات عمليات 
الحفظ (أَيْ: الأموال التي يتم توفيرها من خلال تحسين وظائف دَعُم القرار التقليدية)» والجمع 
(أيْ: الأموال التي يتم توفيرها بسبب جمع ابمعلومات ونشرها آليّا)» وا مستخدمين xil)‏ الأموال 
المحفوظة أو المكتسّبة من القرارات التي يتم اتخاذها باستخدام مستودع البيانات). وتشمل 
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التكاليف كل ما يتعلق بالأجهزة. والبرمجيات» والنطاق التردّدي للشبكة, والتنمية الداخلية؛ إضافةٌ 
إلى العم الداخليء والتدريبء والاستش ارات الخارجية. ويتم حساب القيمة الحالية الصافية على 
مدى العمر المتوقع مستودع البيانات. ونظرًا لأن XY « s] s 983 e 25 Gl‏ لعمليات الحفظ 
gaod XY» g‏ و۰٥‏ للمستخدمين؛ فقد أشار تإلاء؟1 إلى Sg‏ يجبٌ إشراك المستخدمين في عملية 
التطويرء والذي يُعَدُ عامل نجاح حاسم للأنظمة التي تُعني بالتغيير في المنظمة. 

وتُقدّم الحالة العملية 7-٠‏ مثالا لمخزن البيانات الذي تمّ تطويره» وتنفيذه على أساس تنافس شديد 
لشركة مبيعات تجزئة هولندية: وقد أذّى الجَمُْع بين قدرات مستودعات تيراداتا التخزينية والقدرات 
التحليلية مع وجود بنية تحتية للمؤسسة باستخدام حلول 5887 إلى تحقيق نجاح هائل في السوق. 


حالة عملية «-م 
استخدام تحليلات تيراداتا لحلول 548 تُسرّع عملية تسليم البيانات الكبيرة 

إِنَّ الشركة التي تمّ تصنيفها ضمن هذه الدراسة الخاصة باقتناء المنتج, هي عبارة 
عن شركة مملوكة ملكية خاصة لتاجر تجزئة هولنديء وتتكون من 1٠١‏ متجرء هذا 
التاجر لديه ١0‏ علامة تجارية مختلفة عبر العديد من الدول الأوروبية. تشمل منتجات 
عديدة من ألعاب الأطفال إلى أدوات الطهي. وكل علامة تجارية لها البنية التحتية 
الخاصة بها. و: تتم إدارة كلّ كيان تجاري بشكلٍ مستقل عن باقي ال 10 شركة الأخرى؛ 
وذلك في wi‏ تطوير عملياته. والحفاظ على أنظمة تراثه. واتخاذ القرارات التجارية 
لخاصة بالتمويل وتقنية المعلومات» وسلسلة التوريد والعمليات العامة. 

الخلفية: 

ومن أجل تلبية احتياجات بيئة تنافسية دائمة التطؤر؛ فإِنَ ذلك يتطلب رؤيةً ile‏ 

عمال؛ وهو الأمر الذي يمثل تحديًا لمتاجر التجزئة الكبيرة لهذا التاجر الهولندي مع قيام ٠١‏ 

علامة تجارية مستقلة بإدارتها. وللحصول على رؤية أفضل وزيادة كفاءة الأعمال وانخفاض 
التكاليف؛ قرّر بائع التجزئة وَضْعِ إستراتيجية مشتركة لإدارة البيانات في نظام مركزي باستخدام 
قسم تقنية معلومات واحد. وتعني مركزية البيانات أنَّ جميع العلامات التجارية سوف تتم 
دارتها في مستودع بيانات واحد. وتنفيذها حسب العلامة التجارية. مع مراعاة العمليات 
التجارية الفردية واحتياجات كل كيان مستقل. ويتمثل أك تحدٌ يواجه متاجر التجزثة الكبيرة 
في ضرورة دمج العديد من الأنظمة. ها في ذلك أنظمة E۸۴(‏ 54۴) الخاصة بال )٠١(‏ علامة 
تجاريةء وأنظمة إدارة ا مستودعات» وأنظمة نقطة البيع (805). والبيانات الرئيسة للمواد. 
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ومع التركيز على الحفاظ على مرونة الحركة التجارية للمبيعات وتحليل الهامش؛ فقد 
كان هدف تاجر التجزئة هو توفير الوصول إلى مستوى معاملات البيانات الناشئة مما 
يقرب من 00 جدول 547 داخل كلّ نظام 58187. وقد زاد الأمرُ تعقيدًا خاصةً فيما يتعلق 
بالانتقال إلى تهج مركزي؛ بسبب الفروق الدقيقة عبر نظام تخطيط موارد الخمس عشرة 
علامة تجارية. وقد احتاج العمل على إدخال هذه البيانات في المستودع المركزي إلى ٤٠١‏ 
يوم من الجهد لكل نظام. وبالتالي؛ فقد احتاجوا إلى طريقة لتبرير نفقاتهم» وتطوير قيمة 
مقترحة مستمرة لنهج مستودع البيانات الخاصة بهمء وتطوير طريقة لتسهيل هذه العملية. 

قصة اكتساب ez‏ 

ومن الناحية التجارية؛ فإن التركيز ينصبٌ على إنشاء مِنضّة تحليلية مركزية مع 
إمكانية الوصول إلى رؤية شاملة لبيانات المعاملات. ونظرًا للطبيعة الموسمية للتجزئة؛ 
فإن القدرة على الاستفادة من بيانات عدة سنوات أمرٌ مهم للمساعدة في تحديد 
الاتجاهات الموسمية» وإنشاء التوقعاتء وتطوير الأسعار والعروض الترويجية. ويكون 
الهدف من JS‏ ذلك هو تحسين الرؤية وتوفير حرية التحليلات عبر سلسلة التوريد والمواد 
والمبيعات والتسويق مساعدة هذه المؤسسة لتصبح أكثر كفاءةً في طريقة عملها. وبناءٌ 
على ذلك؟ فقد قام بائع التجزئة باختيار قاعدة بيانات تيراداتا؛ نظرًا لأنه يمكنه التعامل 
مع تحليلات المعاملات بالإضافة إلى توفير قدرات تحليلات متقدّمة. وكان هدفهم هو 
دَعْم التحليلات التشغيلية والمرونة عن طريق تنزيل البيانات دون تطوير نظام 1721/15 
أو نماذج منطقية أخرى قبل طرح المستخدمين أسئلة الأعمال. وقد مكّتّهم هذا الأسلوب 
من حفظ البيانات مركزيًا داخل قاعدة بيانات تيراداتا مع توفير المرونة المستقبلية التي 
تتعلق بالوصول إلى البيانات والتقارير والتحليلات لجميع العلامات التجارية. 

وفي سبيل التقليل من تعقيدات 51:8 5472؟ قضّت الشركة الأشهر الستة الأولى تعمل 
بكامل جهدها؛ من أجل تكامل 547 للعملاء المحليين. وبعد ستة أشهر من العرض 
أدركوا المخاطرء وأوقفوا المشروع للتحقيق فيما إذا كانت هناك طرق أفضل للتعامل 
مع هذه المشكلة. ولأول مرة تقوم الشركة باستخدام نظام 51 548 والذي احتاج 
تقريبًا ل 600 يوم حتى يتم فقط تنزی ل OLLI‏ من أول نظام ل E۸۲‏ 547. وهذا 
fa 5 $5) 9 5 eI‏ بالسرعة الكافية؛ لذلك فقد قام تاج ر التجزئة الهولندي بتصعيد 
المشكلة بتصعيد المشكلة ومحاولة استكشاف حل جديد يعمل بطريقة أوتوماتيكية قي 
حل تيراداتا جديد يعمل بطريقة أوتوماتيكية في عمليات الحصول على البيانات عند 
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استخدام 882 542. وقد وقع الاختيار على تحلیلات تیراداتا لحلول 54۲؛ نظرًا لأنه 
تمّ تصميمه خصيضًا لمعالجة التحَدِّيات المرتبطة بإحضار البيانات من dI SAP ERP‏ 
قاعدة بيانات تيراداتا. كما يوفر SAP ERP oble gi (GAB) ÉT Gg Ío‏ $ 
مستودع البيانات pg LS‏ من تنزيل البيانات المطلوبة للعلامة التجارية الأولى في 
غضون ٥‏ أيام فقط بدلا من 60١‏ يوم المقدَّرة باستخدام النظام السابق. وقد قضى بائع 
التجزئة 40 يومًا إضافيًا لإضافة 0!! جدولًا مخصصًا (7) وإعداد البيانات للاستهلاك. مما 
أدى إلى تسريع دَمْج بيانات 547 بنسبة #8٠١‏ وبالتالي توفير 76٠‏ يومًا من العمل. 
التحَدّيات: 


يؤدي الجَمّع بين مشروع توحيد تخطيط موارد المؤسسات بالكامل عبر العديد 
من الأنظمة القدهة إلى إنشاء مشروع به العديد من التعقيدات. وعلى الرغم من أن 
تحليلات تيراداتا لحلول 5847 قد أتاح التشغيل التلقائي لجزء إدارة البيانات امرتبطة ب 
45 مز المشروع؛ فإِنَّ تاجر التجزئة لا يزال يواجه تحديات فنية؛ بسبب حقيقة أن 
مبادرة مستودعات البيانات الخاصة به قد تمّ دمجُها مع مشروع تكامل أوسع. وكان 
النهج الذي اتبعوه هو توحيد الأدوات ووَضْع إطار عمل مع أول علامتين تجاريتين يمكن 
تطبيقهما على الطرح التدريجي لبقية ا منظمة. 

في البداية كانوا بحاجة إلى التوحيد القياسي على أداة .817 وتطوير منهجية جديدة 
وطريقة الاستفادة من ۴۲1. وقد استخدموا أداة .1:11 كأداة تحويل {Extract ELT)‏ 
للتنزيل والحفاظ على تكامل بيانات المعاملات المعقدة. وقد انتهي هذا التاجرٌ إلى 
"Informatica sasl‏ کمعیار ۴۲1 وبيئة E۲1‏ الخاصة به باستخدام ELT àls‏ 
كمُحرّك للبيانات وجدولة المهمة فقط. 

CL a6‏ بالإضافة إلى تخزين بيانات المعاملات الدقيقة؛ فقد استطاع تاجر التجزئة 
الاستفادة من منصّة تيراداتا لتنفيذ جميع تحويلات الأعمال في قاعدة البيانات عند 
نقل البيانات إلى بيئة إعداد التقارير. وقد سمح لهم هذا النهج بالاحتفاظ بنسخة من 
المعاملات الدقيقة. والاستفادة من عمليات التكامل خارج المربع المتوفرة في تحليلات 
تيراداتا لحلول 548؟ بغرض إضافة سياق إلى SAP cla‏ وتسخير قوة قواعد البيانات 
لتطبيق التحويلات والتحليلات الأخرى. 

ثالثاً كان أمرٌ الحصول على بيانات عالية الجودة أمرًا ضروريًا بالنسبة لهم. كما أنهم 
يريدون التأكّد من أن البيانات يكن الوصول إليها وإدارتها على نحو مُتسق. وتوضّح 
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الأرقام المادية أهمية إدارة البيانات بالنسبة إلى هذا التاجر. وقد تمّ تنظيمٌ أرقام المواد 
بشكل مختلفٍ عبر أنظمة متعددة, وكان من الممكن توفيقه ا خلال عملية التنزيل/ 
النموذج. وقد متهم هذا الهيكل الجديد من cla‏ على التحَدَّي الذي واجههم 
بسهولة من خلال إنشاء طرق عَرّْض المواد الفريدة في مستودع البيانات لتنسيق الأرقام 
المادية لإعداد التقارير. 

Talo‏ فقد كان الأمرُ يتطنّبٌ طريقةٌ 1,55 لتقديم البيانات التحليلية والوصول 
للتقارير المتخصصة, والتي يمكنها أيضًا أن تلبِّي المتطلبات المتنوعة للعلامة التجارية. 


ومن خلال الاستفادة من شراكات تيراداتا مع موقّري الحلول مJû “MicroStrategy‏ 
فقد تمكن هذا التاجرٌ من الوصول إلى البيانات الدقيقة المخرّنة في مستودع البيانات في 
أثناء استخدام أدوات ذكاء الأعمال لتطبيق الخوارزميات المناسبة, والاستفادة من المرونة 
المصمّمة ó‏ حَلّ مستودع البيانات. 


وفي البداية؛ كان تطويرٌ مستودع البيانات باعتباره محوراً مركزب ا للوصول إلى 
البيانات؛ أمرًا صعبًا بسبب الحاجة إلى تطوير إطار عمل جديد ومنحنى التعلّم العام 
بسبب التغيير في أسلوب تصميم مستودع البيانات. ولحُسْن الحَظ؛ فإنه بمجرد تطوير 
هذا الإطار. كان التكاملٌ باستخدام برنامج تحليلات تيراداتا لحلول 547 بسيطًا وقابلًا 
للتكرار. ووفقاً لرؤية مخطط المشروع لدى متاجر التجزئة الأوروبية: «يُحَدُ برنامج 
تحليلات تيراداتا لحلول 547 حلاً متكاملاً وسريعاً ومرناً كما أنه يحقق تنميةٌ أسرع, 
ويقلل نسبة المخاطرة, بالإضافة إلى كونه نموذجاً دلاليًا متكاملاً. ويوفر الوصول المباشر 
إلى البيانات التفصيلية». 

الدروس المستقادة: 

وبوجه عام؛ فإن هدف تاجر التجزئة هو توفير إستراتيجية تنفيذ قابلة للتكرار؟ 
من خلال العلامات التجارية الخاصة بالشركة؛ وذلك من أجل تمكين أفضل القرارات في 
العمل؛ إضافةً إلى تحسين كفاءة الأعمالء وخفض تكاليف التشغيل من خلال مركزية 
تقنية المعلومات. وعلى الرغم من أنهم ما زالوا في المراحل الأولى من المشروع؛ فإنهم قد 
تعلّموا من تنفيذ عملية دمج علامتهم التجارية الأولى في مستودع بيانات تيراداتا. ونظرًا 
لاستخدام صاحب الشركة لبرنامج تحليلات تيراداتا لحلول 547؛ فقد تمكّنوا من تسريع 
وقت تقيبم أنشطة التكامل وتبسيطها. إضافةً ead d]‏ من تطوير بعض الفوائد 
التالية لتطبيقها على دمج علاماتهم التجارية اللاحقة والمشاريع المماثلة. 
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وتتمثل هذه الفوائد فيما يلي: 

- أخْذ الوقت الكافي في العناية الواجبة والتعرّف على التقنيات/ الحلول المتوفرة 
لدعم عمليات التنفيذ. وفي هذه الحالة تمكن صاحب الشركة من الاستفادة من برنامج 
تحليلات تيراداتا لحلول 5478؟ مما أدى إلى تقليل وقت التقييم وتمكينه من التركيز على 
التحليلات بدلًا من التكامل. 

- تطوير إطار عمل لتمكين العمليات المتكرّرة التي تمكن أن تعالج تعقيدات الكمية 
الهائلة من البيانات والاحتياجات المخصّصة للأعمال. 

- الجفاظ قدر الإمكان على بساطة تصميم النظام؛ لضمان اعتماد التقنية والنشاط التجاري. 

- التأكّد من توافق القرارات الفنية مع الرؤية الشاملة لتمكين سرعة الأعمال التجارية. 

- تطوير نهج (gel‏ لإدارة البيانات؛ لضمان سلامة البيانات التي تمتدٌ إلى ما بعد 
عملية التنفيذ؛ بحيث يفهم مستخدمو الأعمال والمستخدمون الفنيون كيفية تطبيق 
البيانات للتقارير والتحليلات. 

- تحديد مهلة للتأخير؛ لضمان وَضْعِ حلول -لكلّ من مستودعات البيانات والتكامل- تدعم 
الاحتياجات. مما يعني dj glad‏ حلّ 547 18620214 يدعم أيضًا احتياجاتهم التشغيلية. 

وتطيّق هذه الدروس المستفادة للتنفيذ على نطاق أوسع واستخدام برنامج 
تحليلات تيراداتا لحلول 547. وقد التزم صاحبٌ الشركة بمركزية بنيته التحتية وإدارة 
علاماته التجارية بشكل أكثر فعالية. مما أذّى إلى الاستفادة من هذه الطريقة لجعل 
العملية تتم بطريقة أوتوماتيكية مع تقليل الوقت اللازم لإتمامها؛ بسبب القدرة على 
إرساء jo‏ مُستَهدّف لربط حلول تخطيط موارد المؤسسات لتحليلاتهم. 

أسئلة للمناقشة: 

-١‏ ما هي التحَدِّيات التي واجهتها متاجرٌ التجزئة الهولندية الكبيرة؟ 

gii dol go lo -Y‏ متعدد الأطراف؟ وما هي التحَدِّيات التي واجهت التنفيذ؟ 

Us -Y‏ هي الدروس المستفادة؟ 


Source: Teradata case study. (2015). 800 percent: Use of Teradata* Analytics for 
SAP" Solutions accelerates Big Data delivery. assets.teradata.com/resourceCenter/ 


downloads/CaseStudies/EB8559 TAS Case Study.pdf?processed-1 (accessed July 
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2016); Enterprise Management, Teradata-SAP Solution to Big Data analytics. www. 
enterprisemanagement.com/research/asset.php/3047800-/Percent:-Use-of- Teradata- 


Analytics-for-SAP-Solutions-Accelerates- Big-Data-Delivery (accessed July 2016). 

ومن الواضح أن تحديدَ هدف العملء واجتماع المستخدمين النهائيين للإدارة على دَعْم 
المشروع, بالإضافة إلى تحديد الأَطْر الزمنية والميزانيات المعقولة:» وإدارة التوقعات» كلها أمورٌ 
بالغة الأهمية لنجاح مشروع مستودعات البيانات؛ إذ إِنَّ إستراتيجية مستودعات البيانات هي 
مخطط للتطبيق الناجح في إدخال مستودع البيانات. ويجب أن تقوم هذه الإستراتيجية بِوَضُْف 
الأهداف التي تسعى الشركة إلى تحقيقهاء ولماذا تريدٌ تحقيق هذه الأهدافء وماذا ستفعل عندما 
تحقق هذه الأهداف. كما ينبغي أن تضع في اعتبارها رؤية المنظمة وهيكلها وثقافتها. ولمعرفة 
الخطوات التي يمكن أن تساعد في وَضْع إستراتيجية مرنة وفعّالة يمكنك الاطلاع على Matney,)‏ 
3). عند وَضْعَ خطة ودعم مستودع البيانات؛ فإن المؤسسة تحتاج إلى بحث مُورّدي مستودع 
البيانات» (راجع الجدول ۲-۲ للحصول على قائمة عينات من المورّدينء ويمكنك أيصًا مراجعة معهد 
ex LS .([informationbuilders.com] c»lsslsi! 8059 [twdi.org] c6.JI cole ssz auo‏ 

العديد من المورّدين برامج تجريبية لمستودعات البيانات الخاصة بهم ومنتجات ذكاء الأعمال. 


جدول 7-7: قائمة عيّنات لورّدي مستودعات البيانات 
بائع عروض المنتجات 


مجموعة شاملة من برمجيات ذكاء الأعمال وبرامج 


(businessobjects.com) JlasMI catsls 
(SAPI Ülo تصوير البيانات (المملوكة‎ 





مجموعة شاملة من أدوات ومنتجات مستودع 
(DW) eL‏ 


شركاء الحاسب (cai.com)‏ 





DW slaf 8,89 قسم» وإدارةء‎ (datamirror.com) c5LJI 81a 





مجموعة مزايا البيانات (dataadvantagegroup.com)‏ برنامج البيانات الوصفية 























DW خوادم‎ Dell (dell.com) 
DW lal 8,45 قسمء وإدارةء‎ Embarcadero (embarcadero.com) تقنيات‎ 
مزود حلول البيآانات. وموفر حلول البيانات (مملوك‎ 
E Greenplum (greenplum.com) 
(EMC الآن من قبل‎ 
)0183/( ثمرة وخدمات إدارة علاقات العملاء‎ Harte-Hanks (harte-hanks.com) 





vw‏ ذكاء الأعمال والتحليلات وعلم البيانات. منظور إداري 


التحليلات الوصفية (*): ذكاء الأعمال ومستودعات البيانات 





بائع عروض المنتجات 





DW خوادم‎ HP (hp.com) 





Hummingbird Ltd. (hummingbird.com)‏ محركات 1014 ومستودعات الاستكشاف 





مجموعة شاملة من أدوات» ومنتجات» وتطبيقات 


Hyperion (hyperion.com) Jl 
DW 





«DM s «S5UJI Jal$S | IBM  InfoSphere (www-01.ibm.com/software/‏ وإدارة البيانات الرئيسية, 
ta nfosphere)‏ | ومنتجات البيانات الكبيرة 


























DW clo ã وإدارةء ومر‎ sð Informatica (informatica.com) 
121107 أدوات ومنتجات‎ (microsoft.com) مايكروسوفت‎ 

35515) (DW برنامج وموفر الأجهزة /211 (أجهزة‎ 
tiM لشركة‎ osi Netezza 
CRM ERP; DW أدوات ومنتجات وتطبيقات‎ (Siebel: oracle.comg PeopleSoft :Jaiig) Oracle 
5۷ أدوات ومنتجات وتطبیقات‎ SAS (sas.com) معهد‎ 
DW خوادم‎ Siemens (siemens.com) 
5۷W مجموعة شاملة من أدوات وتطبيقات‎ Sybase (sybase.com) 
5۷ واستشارات وتطبيقات‎ 0W وأجهزة‎ 0W أدوات‎ (Teradata.com) Blsl3 


مناهج تطوير مستودع البيانات: 
تحتاج العديدٌ من المؤسسات إلى إنشاء مستودعات البيانات المُستَخدّمة لدعم القرارء وهناك 

نهجان يستخدمان في هذا الغرضء وهما: 

- النهج الأول: وهو دهج ذكاء الأعمال i$-Jls Il Inmon‏ يُطلّق عليه «أب (7عط)ة18) مستودعات 
ex Inmon 255, 5! «LUI‏ التطوير من أعلى إلى أسفل والذي يتكيّف مع أدوات قاعدة 
البيانات التقليدية الارتباطية؛ وذلك لتلبية احتياجات تطوير مستودع البيانات على مستوى 
Lacus‏ ويُعرّف هذا النهج أيضًَا EDW gẹ cul‏ 

- النهج الثاني: هو لَهْج اله ان۸ طماه۸ والذي اقترح نهجًا تصاعديًا من القاعدة إلى القمة؛ إذ 
يستخدم نمذجة الأبعاد. ويُعرف هذا Ul gall‏ باسم نهج DM‏ 
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الفصل الثالث 


ِنَّ معرفة أوجه التشابه والاختلاف بين هذين النهجين يساعدنا على قَهُمِ مفاهيم مستودع 
البيانات الأساسية (وللمزيد انظر: 2004 ,هناوء:8). وفيما يلي حدول "-" والذي يقارن بين 
هذين النهجين: ويقدَّم وصقًا تفصيليًا لهما: 


جدول #-8: التباين بين نهجي التطوير 221 و1:011 


















































الجهود EDW zai DM gy‏ 
الإطار المجال موضوع واحد ا مجالات عدة مواضيع 
وقت التطوير شهور سنة 
تكلفة التطوير ٠٠٠‏ دولار إلى ٠٠١٠٠١‏ دولار he So b‏ 
صعوبة التطوير منخفضة إلى متوسطة عالية 
المتطلبات المسبقة لتبادل 
عام (داخل منطقة العمل) عام Las ae)‏ 
البيانات 
المصادر فقط بعض الأنظمة التشغيلية والخارجية | العديد من الأنظمة التشغيلية والخارجية 
الأحجام ميجابايتس إلى عدة جيجابايتس جيجابايتس إلى بيتابايتس 
أفق زمني بالقرب من البيانات الحالية والتاريخية | البيانات التاريخية 
تحويلات البيانات منخفض إلى متوسط متوسط 
تحديث التردد كل ساعة» oss‏ أسبوعيًا أسبوعيًاه شهريًا 
التقنية 
المعدات محطات العمل والخوادم والإدارات خوادم المؤسسة وأجهزة الحاسب المركزية 
نظام التشغيل ويندوز ولينكس يونيكسء 05/390 ,2/05 
1 مجموعة العمل أو خوادم قاعدة البيانات . . 
قواعد البيانات 3 خوادم قواعد بيانات المؤسسة 
القياسية 
الاستعمال 
عدد المستخدمين المتزامنين 10s‏ من 1005 إلى 1000s‏ 
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الجهود DM gë‏ | نهج EDW‏ 
أنواع امستخدمين محللي منطقة الأعمال والمديرين | محللي الشركات وكبار المديرين التنفيذين 
إلقاء الضوء على الأعمال تحسين الأنشطة داخل مجال الأعمال | التحسين الانسيابي واتخاذ القرارات 




















المصادر: مقتبس من (2003) .[ ,دء1107 معل هدلا. بيانات المخططات: bps ihò‏ وبناء صغير. كتيب في إدارة 18ء 

«CRC Press: Ariyachandra, T., & Watson, H.2 الطبعة الثامنة, بوكا راتونء فلورايدا:‎ 

ga ghil de Inmon ġa Sys XEDW 4i; ,b) INMON gs -‏ القمة إلى القاعدق 
باستخدام منهجيات وأدوات تطوير قاعدة بيانات dab‏ مثل: الرسوم البيانية للعلاقات بين 


2 
i. 


الکیانات (5۸۲) وتعديل نهج التطوير الحلزوني. ولا يمنع نهج 81167 إنشاء Jis DMs‏ 
NW‏ نظاماً مثاليًا في هذا النهج؛ لأنه يوفر وجهة نظر متسقة وشاملة للمؤسسة, وقد قدم 
(1998) 1111:6222 إطار عمل لتطوير EDW‏ 

- نموذج .1131841.1: إِنَّ نموذج إستراتيجية 124 ل الهادم1 هو «خطةٌ كبيرة وبناءٌ صغير». و 
1 هو مستودع البيانات الموجّهة بالموضوع أو الموجَّهة بحسب القسم. فهو نسخة مُصكّْرة 
من مستودع البيانات الذي يركّز على طلبات قسم معينء مثل: التسويق أو المبيعات. ويطبّق 
هذا النموذج نمذجة بيانات الأبعاد. والتي تبدأ بالجداول. وقد دعا d} Kimball‏ منهجية 
تطوير تستلزم اتباع نهج تصاعديٌّ (من القاعدة إلى القمة)ء وهو ما يعني في حالة مخازن 
البيانات بناء 216 واحد في كلّ مرة. 


ما هو النموذج الأفضل؟ 

لا تُوجّد إستراتيجية واحدة تناسب الجميع لمستودعات البيانات. فمن الممكن أن تتطوّر 
إستراتيجية تخزين بيانات المؤسسة من 124 بسيط إلى مستودع بيانات مُعقّد استجابةً لمطالب 
المستخدمين» ومتطلبات أعمال المؤسسة: ونضج المؤسسة في إدارة موارد البيانات الخاصة بها. 
وبالنسبة للعديد من الشركات؛ فإن نموذج 221 في كثيرٍ من الأحيان هو خطوة أولى مريحة 
لاكنساب الخبرة في بناء وإدارة مستودع بيانات في أثناء عرض مُستخدمي الأعمال بالإضافة إلى 
فوائد الوصول بطريقة أفضل إلى بياناتهم» وتشير علامة 224 عادةًٌ إلى قيمة الأعمال الخاصة 
بمستودعات البيانات. وفي النهاية؛ تُعَدُ هندسة 8218 والتي تدمج 1215 القديمة ومستودعات 
البيانات هي الحل المثالي (انظر: الحالة العملية ؟-؟). ومع ذلك؛ فإنّ تطوير نماذج 12815 الفردية 
يمكنها أن توفر فوائد عديدة في طريقها نحو تطوير 81016؛ خاصةً إذا كانت المؤسسة غير قادرة 
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الفصل الثالث 


أو ليس لديها رغبة في الاستثمار في مشروع على نطاق واسع. كما يمكن أن تظهر دلائل جدوى 
ونجاح نموذج 2315 في تقديم المزايا. وقد يؤدي ذلك إلى استثمار في 810117. ويُلخّص الجدول 
- أهمّ الاختلافات المميزة بين النموذجين. 


جدول :٤-١‏ الفروق الأساسية بين نهجي Kimball Im 0n‏ 

















RDBMS أساليب‎ 





الصفة المميّزة Kimball Inmon‏ 
المنهجية وأسلوب البناء 
النهج العام من أعلى إلى أسفل (تنازلي) من أسفل إلى أعلى (تصاعدي) 
مستودع بيانات «يغذي» قواعد | موذج 12815 عملية تجارية واحدة 
هيكل البناء البيانات الإدارية على مستوى المؤسسة | ويتحقق الاتساق المؤسسي؛ من خلال 
(صغير) ناقل البيانات ومطابقة الأبعاد 
تعقد الأسلوب معقدة جدًا بسيطة إلى حَدٌ كبير 
مقارنة E i‏ عملية من أربع خطوات؛ خروجًا عن 
ارنة مع منهجيات شتقة من المنهجية الحلزونية ية من أربع خطوات؛ خروجًا عن 








التنمية القائمة 



































مناقشة التصميم المادي إدقيق إلى حَذَّ ما as bna‏ 
نمذجة البيانات 
اتجاه البيانات موضوع. أو بيانات مستندة عملية موجهة 
تقليدية ( بيانية تعلاقة الكيان . 
٠ TUUM UR ,‏ |هذجة الأبعاده خروجًا عن النمذجة 
الأدوات [ERD]‏ ورسوم بيانية لتدفق البيانات 
العلائقية 
([BDF]‏ 
إمكانية وصول المستخدم النهاني | منخفض متوسط 
الفلسفة 
الجمهور الرئيسي مُتخصّصو تقنية المعلومات المستخدمون النهائيون 
الموقع في المؤسسة جزء لا يتجزأ من قاعدة معلومات الشركات | محوّل وخادم البيانات التشغيلية 
v"‏ ذكاء الأعمال والتحليلات وعلم البيانات. منظور إداري 
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Kimball Inmon الصفة المميّزة‎ 





nm 3 
تقديم حلّ يُسِهّل على المستخدمين النهائيين‎ 
مباشر‎ Ki الاستعلام عن البيانات‎ 
والحصول عليها في أوقات استجابة معقولة‎ 
Sources: Adapted from Breslin, M. (2004, Winter). Data warehousing battle of the giants: Comparing the 


basics of Kimball and Inmon models. Business Intelligence Journal, 9(1), 6-20; Ariyachandra, T., & Watson, 
H. (2006b). Which data warehouse architecture is most successful? Business Intelligence Journal, 11(1). 


de ie ea iis Jos eis 


2 bgl 
موضوع أساليب وتقنيات قاعدة البيانات المجرّبة‎ 

















اعتبارات إضافية لتطوير مستودع البيانات: 

تريد بعص ال منظمات الاستعانة مصادر خارجية بالكامل في جهود مستودعات البيانات؛ إذ إنهم 
لا يريدون اقتناء البرمجيات والأجهزة» كما أنهم لا يريدون التعامل مع إدارة نظم المعلومات الخاصة 
بهم وليس لديهم سوى بديلٍ واحد وهو استخدام مستودعات البيانات المستضافة. وفي هذه الحالة؛ 
فإن الحل المثالي هو قيام شركة أخرى لديها الكثيرٌ من الخبرة وامهارة» بتطوير مستودع البيانات 
والحفاظ عليه. غير أنَّ هناك مخاوف تتعلق بالأمان والخصوصية مع استخدام هذا النهج (وللحصول 
على المزيد من التفاصيل راجع الرؤية الفنية .)١-7‏ 


تمثيل البيانات في مستودع البيانات: 

يُظهر هيكل مستودع البيانات النموذجي في الشكل ٤٠-١‏ إمكانيةٌ إجراء العديد من أشكال 
بنية مستودع البيانات (انظر: (A-Y JKA‏ وبغضٌ النظر عن البنية الهندسية؛ فقد كان تصميمٌ 
تمثيل البيانات في مستودع البيانات يعتمدٌ دائما على مفهوم النمذجة البعدية. وتُعرّف النمذجة 
البعدية كنظام قائم على الاسترجاع يدعم وصول طلبات البحث ذات الحجم الكبير. ويجبٌ أن 
يتم تصميمٌ وتمثيل البيانات في مستودع ولكن أيمًا تعرّز معالجة الاستفسارات المعقدة المتعددة 
الأبعاد. وفي كثير من الأحيان؛ فإنَّ مخطط النجمة ومخطط 500111216 هما الوسيلة التي يتم 
ius lp‏ النمذجة البعدية في مستودعات البيانات. 
نمذجة الأبعاد استخدامًا. ويحتوي مخطط النجوم على جدول حقائق مركزي مُحاط بعدَّة جداول 
أبعاد ومتصلٌ بها (2009 ,3502ة40). ويحتوي جدول الحقائق على عدد كبيرٍ من الصفوف التي 
تتوافق مع الحقائق الرئية والروابط الخارجية (أيْ: مفاتيح خارجية). ويحتوي جدول الحقائق 
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الفصل الثالث 


على السّمات الوصفية اللازمة لإجراء تحليل القرار وإعداد تقارير الاستعلام ويم استخدام ا مفاتيح 
الخارجية للارتباط بجداول الأبعاد. وتتكوّن سمات تحليل القرار من مقاييس الأداء والمقاييس 
التشغيلية» والمقاييس المجمّعة (مثل: حجم المبيعات» ومُعدّلات الاحتفاظ بالعملاءء وهوامش الرّبح» 
وتكاليف الإنتاج» ومعدّل الخردة) وجميع المقاييس الأخرى اللازمة لتحليل أداء المنظمة. وبعبارة 
أخرى؛ فإنَّ جدول الحقائق يتناول بشكلٍ أساسيٌ ما يدعم مستودع البيانات لتحليل القرارات. 

Ól‏ جداول الحقائق المركزية المحيطة (وا مرتبطة عبر المفاتيح الخارجية) هي جداول الأبعاد. 
وتحتوي جداول الأبعاد على تصنيف وتجميع المعلومات حول صفوف الحقائق المركزية. كما 
تحتوي على السّمات التي صف البيانات الموجودة داخل جدول الحقائق» وتتناول كيفية تحليل 
البيانات وتلخيصها. وإضافة إلى ذلك؛ فإنها تحتوي أيضًا على علاقة واحد - إلى - مُتعدّد في جدول 
الحقائق ال مركزيةء وعند استخدام الاستعلام يتح استخدامٌ الأبعاد لوضع القيم العددية في شرائح 
من ٠-١‏ في جدول الحقائق لتلبية الاحتياجات المتعَلّقة بالمعلومات. وقد تمّ تصميمٌُ المخطط 
النجمي؛ بهدف توفير وقت الاستعلام والحصول على استجابة سريعة؛ إضافةً إلى بساطته وسهولة 
صيانة هياكل قاعدة بيانات القراءة فقط. ويوضّح الشكل 88-١٠مخططاً‏ نجمياً بسيطاً Zg‏ 
المخطط النجمي حالةً خاصةً لمخطط مجموعة الثلج (©>لة0::11م5). 

وبالنسبة المخطط مجموعة الثلج (50019021)؟ فهو عبارة عن ترتيب منطقي للجداول في قاعدة 
بيانات مُتعدّدة الأبعاد؛ بحيث يشبه المخطط الارتباطي مجموعة الثلج في الشكلء ويرتبط مخطط 
مجموعة الثلج (5001121) ارتباطًا وثيقا بالمخطط النجمي عن طريق جداول حقائق مركزية 
(تكون واحدة فقط عادةً) والتي ترتبط بأبعاد متعددة. ومع ذلك ففي مخطط مجموعة الثلج 
Jolas õue JI aled! igas ey (Snowflake)‏ مرتبطة ببعضهاء في حين يتم تقوية أبعاد مخطط 
النجمةء مع تمثيل كلّ بُعْد بجدول واحد. ويظهر مخطط مجموعة ثلج بسيط في الشكل 1٠١-87‏ 


مخطط كتلة الثلج مخطط النجمة 
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شكل :1١-۳‏ () مخطط النجمةء و(6) مخطط كتلة الثلج 
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التحليلات الوصفية (): ذكاء الأعمال ومستودعات البيانات 


رؤية فنية *-1: مستودعات البيانات المُستضّافة 

يحتوي مستودع البيانات المستضاف على نفس الوظيفة؛ إن لم يكن أكثر؛ فهو يعمل كمستودع 
بيانات في ام موقع» غير أنه لا يستهلك موارد الحاسب في أماكن عمل العميل. PAR‏ مستودع 
البيانات المستضاف مزايا ذكاء الأعمال مطروحًا منها تكلفة تحديثات الحاسبء وتحديثات 
الشبكة, وتراخيص البرامج والتطوير الداخلي والدعم الداخلي والصيانة. 

edi‏ مستودع البيانات المستضاف المزايا التالية: 

- يتطلّب الحَدَّ الأدنى من الاستثمار في البنية التحتية. 

يُحرّر القدرة على الأنظمة الداخلية. 
يُحرّر التدفق النقدي. 
- يُقدّم حلولاً قويةٌ بأسعار معقولة. 
- كن الحلول القوية التي تساعد على النمو. 
- يُقدّم مُعَذَّات وبرامج ذات جودة أفضل. 
K"E‏ اتصالات أسرع. 
GŠ -‏ المستخدمين من الوصول إلى البيانات من المواقع البعيدة. 
- يسمح للشركة بالتركيز على الأعمال الأساسية. 
- يفي باحتياجات التخزين لأحجام كبيرة من البيانات. 

es‏ الرغم من مُميّزات مستودع البيانات امس تضاف؛ فان ذلك لا يستلزم أن يكون مناسبًا 
لكل منظمة. فبعض الشركات الكبيرة التي تتجاوز عائداتها 0٠١‏ مليون دولار قد تخسر الأموال إذا 
كان لديها بالفعل بنيةٌ تحتيةٌ داخلية وموظفون في مجال تقنية المعلومات. وعلاوةٌ على ذلك؛ فإن 
الشركات التي ترى أن التحؤل النموذجي يحدث عن طريق الاستعانة بمصادر خارجية في تطبيقات 
فقدان السيطرة على التحكّم في البيانات الخاصة بهم لا تفضل استخدام مُقدَّم خدمة ذكاء الأعمال. 
وأخيرا؛ فإن أكثر الحجج شيوعًا والتي تعيق تطبيق مستودع البيانات المستضافة. هو أنه قد يكون 
من غير الحكمة الاستعانة بمصادر خارجية للتطبيقات الحساسة لأسباب تتعلق بالأمان والخصوصية. 


*ok. 


تحليل البيانات في مستودع البيانات: 
هجرد تخزين البيانات بشکل مناسب à‏ مستودعات البيانات؟ يمكن استخدامها بطرق 
مختلفة لدعم القرارات التنظيمية. ids‏ القول بأن تقنية 01.4 هي تقنية تحليل البيانات 
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الأكثر استخدامًا في مستودعات البيانات» وقد تزايد الإقبال على هذه التقنية؛ بسبب الزيادة 
الهائلة في حجم البيانات والاعتراف بالأعمال القيّمة للتحليلات المبنية على البيانات. وببساطة؛ 
فإن 0142© هو نهج للإجابة بسرعة عن الأسئلة المخصّصة عن طريق تنفيذ استفسارات تحليلية 
متعدّدة الأبعاد ضد مستودعات البيانات التنظيمية (أي: مستودعات البيانات. (DMsg‏ 


42 مقابل 01:12: 


OLTP c laa edo a‏ )525 نظام معالجة المعاملات عبر الإنترنت) في نظام المعاملات 
المسئول بشكل أساسيٌ عن التقاط وتخزين البيانات المتعلّقة بوظائف العمل اليومية. مثل: 85۸۴ء 
.CRMs‏ و5030 و505, وغيرها. ويتعامل نظام 01018 مع احتياجات الأعمال الحساسة, وأداء 
معاملات الأعمال اليومية بطريقة أوتوماتيكيةء وتشغيل التقارير فوريًاء والتحليل الروتيني. غير 
أنّ هذه الأنظمة ليست مُصمّمة للتحليل المُخصّص والاستفسارات المعقدة التي تتعامل مع عدد 
من عناصر البيانات. ومن ناحية أخرى؛ فقد تمّ تصميمٌ 01.42 بلعالجة هذه الحاجة؛ من خلال 
توفير تحليلٍ مُخصّصٍ للبيانات التنظيمية بشكل أكثر فعاليةٌ وكفاءةً. ويعتمد كلّ من 01.87 و 
۶ بشکل کبیرٍ على بعضهما؛ إذ يستخدم 01.87 البيانات التي تم التقاطها بواسطة 011۲ 
ويقوم 01:12 آليًا بإجراء عمليات الأعمال التي تتم إدارتها بواسطة القرارات التي يدعمها 
42آ0. ويقدّم الجدول 0-8 مقارنةَ متعددة المعايير بين -OLAPs OLTP‏ 


جدول *-0: مقارنة بين 011۶ و01۸۴ 





OLAP OLTP المعايير‎ 


3 لدَغم صُنْع القرار وتقديم إجابات 
الغرض leceh‏ العمل iasi‏ 

لغرض يام بمهام ايوم لاستفسارات الأعمال والإدارة 
قاعدة بيانات المعاملات (مستودع 


مصدر البيانات أبيانات عادي يركز بشكلٍ أساسي على 


مستودع البيانات أو 4 (مستودع 
بيانات غير طبيعي يركز في المقام الأول 


الكفاءة والاتساق) على الدقة والاكتمال) 
L : 1 5‏ 2 أتقارير واستعلامات مُخصّصة ومتعددة 
التقارير تقارير دورية» وروتينية ومركزة بدقة 





الأبعاد ومركزة على نطاق واسع 
المعالجات» وقواعد البيانات المتخصّصة 


متطلبات المصدر | قواعد البيانات المترابطة (العلائقية) العادية 
i‏ ا : s‏ أذات السعة الكبيرة 
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OLAP OLTP ا معابير‎ 





سريع (تسجيل المعاملات التجارية | بطيء (موارد مكثفة. ومعقدة. 
والتقارير الروتينية) واستعلامات واسعة النطاق) 














عمليات 01.42: 
يعتمد الهيكل التشغيلي الرئيسي في 01,8 على مفهوم يُسمّى المكعب. والمكعب في 
OLAP‏ هو عبارة عن بنية بيانات متعددة الأبعاد (فعلية أو افتراضية) والتي تسمح بتحليلٍ 
سريع للبيانات» كما يكن تعريف المكعب بأنه القدرة على معالجة البيانات وتحليلها بكفاءة 
من وجهات نظر agis odas‏ ترتيب البيانات في مكعبات إلى cds‏ على القصور في قواعد 
البيانات المترابطة (العلائقية)؛ إذ إِنَّ قواعد البيانات (المترابطة) العلائقية لا تناسب التحليل 
الفوري لكميات كبيرة من البيانات بشكلٍ جيد؛ بل إنها بدلا من ذلك تتيحٌ الفرصة للتلاعب 
بالسُّجلات (من خلال إضافة وحذف وتحديث البيانات) والتي تمثل سلسلةً من المعاملات. وعلى 
الرغم من وجود العديد من أدوات كتابة التقارير لقواعد البيانات العلائقية؛ فإِنَّ هذه الأدوات 
تكون بطيئة عند تنفيذ استعلام متعدد الأبعاد يشمل العديد من جداول قاعدة البيانات. 
وباستخدام 0147 JA Jin SE‏ عبر قاعدة البيانات والشاشة لمجموعة فرعية مُعيّنة 
من البيانات (وتطويرها بمرور الوقت) عن طريق تغيير اتجاهات البيانات وتعريف العمليات 
الحسابية. وتُسمّى هذه الأنواع من التنقلات التي يقوم lé‏ المستخدم من خلال تحديد شرائح (عن 
طريق التناوب) والتنقل لأسفل/ لأعلى (عبر التجميع والتصنيف) أحيانًا ب «شريحة ونرد»» وتتضمّن 
عمليات 01.47 الشائعة الاستخدام شريحةً ونرداً والتنقيب لأسفلء ولفة المتابعة والمحور. 
- الشريحة: هي عبارة عن مجموعة فرعية من صفيف مُتعدّد الأبعاد (وعادةً تمثيل ثنائي الأبعاد)» 
هذه المجموعة تطابق قيمةً واحدةً els asd‏ (أو أكثر) من الأبعاد غير الموجودة في المجموعة 
الفرعية. ويبَيّن الشكل ١١‏ عملية تشريح بسيطة على مكعب ثلاني الأبعاد. 
- حجر الّرد: " هي عبارة عن شريحة على أكثر من بُعدّين من مكعب البيانات. 
- التنقل لأسفل/ لأعلى: التنقل لأسفل أو لأعلى هو تقنية 014۴ مُحدَّدة؛ إذ يتنقل المستخدم بين 
مستويات البيانات التي تتراوح من الأكثر إيجارًا (أعلى) إلى الأكثر تفصيلًا (أسفل). 
- لفة المتابعة: يتضمّن اللف إلى الأعلى حساب جميع علاقات البيانات لواحد أو أكثر من الأبعاد. 
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وللقيام بذلك؛ قد يتم تعريف علاقة حسابية أو صيغة. 
- المحور: ويُستَخدّم لتغيير اتجاه الأبعاد لتقرير أو عرض صفحة الاستعلام المخصّص. 


مكمب 0_۸۲۴ ثلاٹی الابعاا 
























































شكل :1١-‏ عمليات تقطيع على مكعب بيانات بسيط ثلائي الأبعاد 
أسئلة مراجعة على القسم 5-7: 
-١‏ اذكر فوائد مستودعات البيانات. 
-١‏ اذكر عِذَّة معايير لاختيار بائع مستودع البيانات» واذكر سبب أهميتها. 
Sg OLAP go la -Y‏ يختلف عن 01:12؟ 
-٤‏ ما هو المكعب؟ وماذا يعني التنقل لأسفلء واللف» والشريحة» والترد؟ 


۷-۳ قضايا تنفيذ عملية مستودعات البيانات: 
ِنّْ عملية مستودعات البيانات بشكل عام تتطلّب جهدًا هائلًا يجب التخطيط له وتنفيذه 
وفقاً للأساليب المتبعة. غير أن دورة حياة المشروع لها عد جوانب ولا يمكن لأيّ شخصٍ أن يكون 
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خبي في كل المجالات. ولذلك فنحن هنا بِصَدّد مناقشة أفكار وقضايا مُحدَّدة لها صلة بعملية 
مستودعات البيانات. 
يرغبُ الناس في معرفة مدى نجاح مبادرات ذكاء الأعمال ومخازن البيانات الخاصة بهم مقارنةٌ 
بمبادرات الشركات الأخرى. وقد (iv 3) Watson Ariyachandra je js esl‏ بعض معايير نجاح 
ذكاء الأعمال ونشاط مستودعات البيانات. كما قام «Gonzalez; Gerard g Watson (a js‏ 3 
Haywood‏ و(1999) Fenton‏ بالبحٹ فی حالات فشل مستودع البيانات. وقد أظهرت نتائجهم 
أنَّ الناس يعرفون «الفشل» بطرق مختلفة» وهذا ما أده Watson) s .Ariyachandra (34 js‏ 
00006 وقد قام laxa‏ مستودعات البيانات (051.08) بتطوير موذج متكاملٍ مستودعات 
البيانات تستطيع المؤسسة تطبيقه لقياس مدى تطوّرها. ويقدّم النموذج وسيلةٌ سريعة å‏ لقياس 
مدى صلاحية مكان مستودعات البيانات الخاصة بالمنظمة في الوقت الحاليء وكذلك الأماكن التي 
Goo‏ إلى الانتقال إليها فيما بعد. ويتكوّن نموذجٌ النضج من ست مراحل» وهي: مرحلة ما قبل 
BII‏ الرضاعة, الطفولة» المراهقة» البلوغ الحكمة. 
وترتفع 15 الأعمال مع تقدُّم مستودع البيانات خلال كلّ مرحلة من مراحل النجاح. us‏ تحديدٌُ 
المراحل من خلال عدد من الخصائص» ا في ذلك النطاق» والهيكل التحليليء والتصؤرات التنفيذيةء وأنواع 
التحلي لات والإشراف» والتمويل» وبرنامج التقنية. وإدارة التغي يب والإدارة ومزيدِ من التفاصيل انظر: 
-Eckerson (2003)5 .Watson(2009)s .Twogood ; .McGiverns .Hackathorns .Eckerson‏ 
تتسمٌ مشاريعٌ مستودع البيانات بالعديد من المخاطر. كما أنَّ معظم هذه المخاطر موجودة 
أيمًا في مشاريع تقنية المعلومات الأخرى» ولكن مخاطر مستودعات البيانات أكثر خطورةٌ؛ لأن 
مستودعات البيانات غالية الثمن وتتطلب الكثير من الوقت والموارد. ومشاريع واسعة النطاق. 
لذلك؛ فإن التطوير الناجح لمستودع البيانات يتطلّب تقييم كلّ خطر في بداية المشروع. ومن 
all‏ التفكير بعناية في مختلف المخاطر, وتجنّْب المشكلات التالية: 
- الخطأ في اختيار الرُعاة: فأنت بحاجة إلى راع تنفيذي له نفودٌ على الموارد الضرورية لدعم واستثمار 
مخزن البيانات. كما أنك تحتاجُ أيضًا إلى قائد تنفيذيّ للمشروع, ولا بد أن يكون هذا القائد La‏ 
اكتسب احترام المسؤولين التنفيذيين الآخرين؛ ولديه شكوكٌ مقبولة حول التقنيةء كما أنه لا بُذّ أن 
يتصف بالحَزم مع ا مرونة. وإضافةً إلى ذلك؛ فإنك أيضًا تحتاج إلى مدير "15/11 ليرأس المشروع. 
- تحديد توقعات يَصعُب الوفاء بها: أنت لا تريد إحباط المديرين التنفيذيين بإخبارهم بحقائق 
معينة. JS‏ مشروع من مشاريع مستودعات البيانات يتكوّن من مرحلتين: 
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- المرحلة الأولى: هي مرحلة البيع؛ إذ تقوم بتسويق المشروع داخليًا عن طريق بيع الفوائد 
لَنْ يستطيعون الوصول إلى الموارد المطلوبة. 
- المرحلة الثانية: وتتمثل في الاجتهاد؛ من أجل الوفاء بتوقعات المرحلة الأولى» فبمجرد أن 
يكون لديك ما بين Y‏ و/ ملايين دولار؛ فإننا نأمل أن تتمكّن من تحقيق ذلك. 

- الانخراط في اتباع نهج لوك غير جيد: ببساطة لا تقل بأن مستودعات البيانات ستساعد 
المديرين في اتخاذ قرارات أفضل؛ لأن ذلك ضمنياً يعني أنَّ قراراتهم السّابقة غير جيدة حتى 
الآن. ولكن قم بالترويج لفكرة أنهم سيكونون قادرين على الحصول على المعلومات التي 
يحتاجونها للمساعدة في صُنْع القرار. 

- تحميل الممُستودّع بالمعلومات لمجرد توقّرها: لا تجعل مستودع البيانات مُكِبًا للبيانات؛ لأن 
هذا من شأنه أن يُبطئ استخدام النظام بغير داع. وهناك اتجاهٌ نحو الإحصاء والتحليل بشكلٍ 
فوري. ويجب إغلاق مستودعات البيانات في الوقت المناسب. 

- الاعتقاد أن تصميمَ قاعدة بيانات؛ من أجل مستودعات البيانات هو نفس تصميم قاعدة 
بيانات المعاملات: وبشکل عام؛ فإنه ليس كذلك. فالهدف من مستودعات البيانات هو 
الوصول إلى ا مجاميع بدلا من السجلات الفردية أو القليلة؛ كما هو الحال في أنظمة معالجة 
المعاملات. ويختلف المحتوى أيضًَا كما هو واضح في كيفية تنظيم البيانات؛ إذ تميل نُظم 
إدارة قواعد البيانات (082/15) إلى أن تكون غير مفرطة» وطبيعية» ومترابطة» في حين تكون 
مستودعات البيانات زائدة عن الحاجة. وليست طبيعية» ومُتعدّدة الأبعاد. 

- اختيار مدير مستودع البيانات» والذي يكون مُوجهًا للتقنية بدلا من المستخدم: يتمثل أحد 
مفاتيح نجاح مستودع البيانات في فهم ضرورة حصول المستخدمين على احتياجاتهم» وليس 
التقنية المتقدّمة من أجل التقنية. 

- التركيرٌ على البيانات الداخلية التقليدية الموجّهة للسجلء وتجاهل قيمة البيانات الخارجية 
والنصوص والصورء ورها الصوت والفيديو: تأني البيانات بأشكال عديدةء ويجب أن تكون متاحةٌ 
للأشخاص المناسبين في الوقت المناسب وبالشكل الصحيح. ويجبٌُ أن يتمّ فهرستها بشكلٍ صحيح. 

- تقديم البيانات باستخدام تعريفات متداخلة ومذهلة: يُعَذٌ تطهيرٌ البيانات جانبًا مهمًا من 
مستودعات البيانات. ويشمل التوفيق بين تعريفات وتنسيقات البيانات المتعارضة على 
مستوى المنظمة» غير أنَّ ذلك قد يكون صعبًا من الناحية السياسية؛ نظرًا لأنه ينطوي عادةً على 
تغيير المستوى التنفيذي. 
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- الإهانُ بالقدرة على الوفاء بوعود الأداء, والقدرة والقابلية للتطوير: تتطلّب مستودعات البيانات 
Åe pug au ple Ner‏ أكبر مما هو مرصود في الميزانية. أيْ: التخطيط للمستقبل على نطاق واسع. 
- الاعتقاد أنَّ المشكلات قد انتهت عندما يكون مستودع البيانات جاهرًا: إذ تحتاج مشاريع /81 
5 إلى التطوير بشكلٍ مستمر. فكلُ نَشْر هو تكرار لعملية النماذج الأولية. وسيكون هناك 
حاجةٌ دائمةٌ لإضافة المزيد من مجموعات البيانات المختلفة إلى مستودع البيانات؛ إضافةٌ إلى أدوات 
تحليلية إضافية للمجموعات الموجودة والإضافية من صَنّاع القرارء كما يجب تخطيط الطاقة العالية 
والميزانيات السنوية؛ لأن النجاح يُولّد نجاحاًء فبناء مستودعات البيانات عملية مستمرة. 
- التركيز على التنقيب في البيانات المخصمّصةء وتقديم التقارير الدورية بدلا من التنبيهات: إن 
التطؤر الطبيعي للمعلومات في مستودع البيانات هو: )١(‏ التنقيب في البيانات من الأنظمة 
القدمة, وتطهيرهاء وتغذية المستودع بهاء (7) دَعْم التقارير المخصّصة حتى كنك التعرّف على 
ما يريده الناسء (؟) تحويل التقارير المخصّصة إلى تقارير مجدولة بانتظام. وهذه العملية 
المتمثلة في معرفة ما يريده الناس من أجل توفيره تبدو طبيعية؛ لكنها ليست الأمثل أو حتى 
عملية. فا مديرون مشغولون وهم في حاجة إلى الوقت لقراءة التقارير؛ ولذلك oj‏ أنظمة 
التنبيه أفضل من أنظمة التقارير الدوريةء ويمكنها أن تجعل مهمة مستودع البيانات حاسمةٌ. 
وتقوم أنظمة التنبيه بمراقبة تدفق البيانات إلى المستودع وإبلاغ جميع الأشخاص الرئيسيين 
الذين يحتاجون إلى معرفة أي حَدَتْ مهم فور وقوعه. 
في العديد من المؤسسات,. لن يكون مستودع البيانات ناجحًا إلا إذا كان هناك دَعْمٌ قوي 
من الإدارة العليا من أجل تطويرهء وإذا كان هناك بطل للمشروع ارتقى إلى أعلى في الهيكل 
التنظيمي. فعلى الرغم من أنَّ هذا الأمر من المحتمل أن يكون صحيحًا في أي مشروع كبير لتقنية 
المعلومات؛ فإنه مهم بشكلٍ خاصٌ لتنفيذ مستودع البيانات. إذ يؤدي التنفيذ الناجح ممستودع 
البيانات إلى إنشاء هيكل إطار عمل قد يسمح بتحليل القرارات في جميع أنحاء المؤسسة. وفي 
بعض الحالات يوفر SCM Lab‏ شاملاً؛ وذلك من خلال منح الوصول إلى المعلومات الخاصة 
بعملاء ومورّدي المنظمة. وقد سهّل تنفيذٌ مستودعات البيانات المستندة إلى الويب (والتي تُسمّى 
أحيانًا I daos! (Webhousing‏ كميات هائلة من البيانات. ولكن من الصعب تحديد الفوائد 
الثابتة المرتبطة بمستودع البيانات. إذ يتم تعريف الفوائد الثابتة على أنها منافع للمنظمة التي 
تمكن التعبيرٌ عنها من الناحية النقدية. ويُوجَّد لدى العديد من المنظمات موارد محدودة لتقنية 
المعلومات غير أن الأولوية يجب أن تُعطى للمشاريع. وقد يساعد الدعم الإداري والبطل القوي 
للمشروع في ضمان أن يتلقى مشروع مستودع البيانات ال موارد اللازمة للتنفيذ الناجح. كما أن موارد 
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مستودع البيانات قد تكون مكلفةً بشكل كبير. وفي بعض الحالات تتطلب معالجات عالية الجودة 
وزيادات كبيرة في أجهزة تخزين الوصول المباشر. وقد تحتوي مستودعات البيانات المستندة إلى 
الويب أيضًا على متطلبات أمان خاصة؛ لضمان وصول المستخدمين المصرّح لهم فقط إلى البيانات. 
تُعَذُ مشاركة المستخدمين في تطوير البيانات ونماذج الوصول عاملًا حاسمًا في نجاح تطوير 
مستودع البيانات؛ إذ إنه في أثناء نمذجة البيانات يكون عامل الخبرة مهما لتحديد البيانات 
المطلوبة» وتحديد قواعد العمل المرتبطة بالبيانات؛ إضافةً إلى تحديد ا مجموعات والحسابات 
الأخرى التي قد تكون ضرورية. وهناك حاجة لنمذجة الوصول لتحديد كيفية استرجاع البيانات 
من مستودع البيانات» كما أنها تساعدٌ في التعريف المادي للمستودع من خلال اللمساعدة في 
تحديد البيانات التي تتطلب فهرسة. وقد تشير أيضًَا إلى ما إذا كانت 21/15 التابعة مطلوبة 
لتسهيل استرجاع المعلومات. وإضافةً إلى ذلك؛ فإن هناك حاجة إلى مهارات فريق لتطوير وتنفيذ 
مستودع البيانات» بما في ذلك المعرفة المتعمّقة لتقنية قواعد البيانات وأدوات التطوير امستخدمة. 
وتشررٌ أنظمة المصدر وتقنية التطوير - كما سبق أن ذكرنا - إلى العديد من المدخلات والعمليات 
الممستخدّمة لتنزيل وصيانة مستودع البيانات. وتمثل الحالة العملية #-6 مثالًا ممتازًا على تطبيق 
واسع النطاق لمستودع بيانات متكامل من قبل حكومة الولاية. 
حالة عملية ٤-۳‏ 
5W‏ يساعد على رَبْط وكالات الدولة في ولاية میشغان 
تؤثر إدارة صهونط:3 للتقنية والإدارة واميزانية (2121) على كل مجالٍ من 
مجالات الحكومة؛ من خلال خدمة العملاء وتحسين ال موارد. والاستخدام المبتكر 
للمعلومات والتقنية» ويعتمد ما يقرب من ٠٠٠٠١‏ مستخدم في 0 أقسام رئيسة و١٠‏ 
وكالة وأكثر من ٠‏ مكتب على 810187 للقيام بمهامّهم بشكلٍ أكثر فاعلية وخدمة أفضل 
للمقيمين في .Michigan‏ ويحقق EDW‏ مليون دولار في يوم عمل في الفوائد اطالية. 
وقد ساعد 81187 ميشيغان في تحقيق فوائد مالية سنوية بقيمة ۲۰۰ مليون دولار 
ضمن قسم صحة المجتمع وَحْده؛ إضافةً إلى 1/0 مليون دولار أخرى في السنة ضمن دائرة 
الخدمات الإنسانية (2115). وتشمل هذه المدخرات فوائد سلامة البرنامج» وتفادي 
التكاليف؛ يسبب تحسّن النتائج» وتجنب العقوبات, والكفاءة التشغيلية» واسترداد 
المدفوعات غير الملائمة ضمن برنامج 36641814 الخاص بها. ويوفّر مستودع البيانات 
DHS‏ ضف Michigan )(W(‏ معلومات فريدة ومبتكرة حاس مة لعمل الوكالة بكفاءة 
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من المستوى الإستراتيجي والتكتيكي. فعلى مدى السنوات العشر الماضية حققت شركة 
217 نسبة فعالية التكلفة 1:10: وتُسهم المعلومات الموخّدة من 218 الآن في جميع 
وظائف 12115 تقريبًاء مما في ذلك التسليم الدقيق والمحاسبة للفوائد المقدّمة مما يقرب 
من ۲,۵ مليون عميل من موظفي الذَّعم العام. 

وكانت نط1[ طموحة في محاولاتها لحَلّ مشكلات الحياة الحقيقية من خلال 
المشاركة المبتكرة والتحليلات الشاملة للبيانات؛ إذ كان نهجها تجاه 81/95 دات 
«مشروعًا» (على مستوى الولاية) بطبيعته» بدلا من وجوه منصًّات منفصلة من /81 
JSI DW.‏ منطقة عمل أو وكالة حكومية. وقد استفادت Alla coles o» Michigan‏ 
من البيانات لإنشاء أساليب مبتكرة لاستخدام 81/0۷ وتقديم حلول مؤسسية تتسم 
بالكفاءة والمصدّاقية باستخدام قنوات متعددة؛ وذلك من خلال إزالة الحواجز التي 
تحول دون مشاركة بيانات المؤسسات عبر وحدات الأعمال. 

أسئلة للمناقشة: 

EDW تستثمر الدولة في بنية أساسية كبيرة ومُكلّفة لتقنية المعلومات (مثل‎ ISU -Y 

-Y‏ ما هو حجم وتعقيد 81117 امُستَخدّمة من قبل وكالات الدولة في ولاية صمعن2/1؟ 


SEDW الحصول عليھا من‎ e ما هی التحَدّيات وَالحَلٌ المقترح والنتائج التي‎ ۳ 
Sources: Compiled from TDWI Best Practices Awards 2012 Winner, Enterprise 
Data Warehousing, Government and Non-Profit Category. Michigan Departments 
of Technology, Management & Budget (DTMB), Community Health (DCH), and 
Human Services (DHS). TDWI What Works, 34, 22; michigan.michigan.gov. 


مستودعات البيانات الضخمة وقابلية التطوير: 

يحتاج مستودع البيانات إلى دعم قابلية التوسّح بالإضافة إلى ا مرونةء وتتمثل القضايا الرئيسية 
ا متعلقة بقابلية التطوير فيما ياي: مقدار البيانات المموجودة في المستودع ومدى سرعة مو 
مستودع التخزين» وعدد المستخدمين المتزامنين» وتعقيد طلبات المستخدمين» كما يجب أن يتسع 
مستودع البيانات أفقيًا وعموديًا. وسوف ينمو ال مستودع IIS‏ لنمو البيانات والحاجة إلى توسيع 
المستودع لدعم وظائف الأعمال الجديدة. وقد يكون نمو البيانات ناتجًا عن إضافة بيانات الدورة 
الحالية (على سبيل المثال: نتائج هذا الشهر) أو البيانات السابقة. 
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وقد وَصَف هيكس (20-1) قواعد البيانات الضخمة ومخازن البيانات. وتقوم ۷112۲ 
باستمرار بزيادة حجم مستودع البيانات الضخم الخاص بها. ومن المعتقد أن Walmart‏ تستخدم 
مستودعًا يحتوي terabytes jo Olis de‏ من البيانات لدراسة اتجاهات المبيعات, وتتبّع المخزون» 
وتنفيذ مهامً أخرى. وقد قامت 1834 مؤخرًا بنشر مؤشرها الخاص بالمستودع الذي يبلغ ٥٠‏ 
تيرابايت (1831.2009). الجديرٌ بالذكر أن وزارة الدفاع الأمريكية تستخدم مستودعًا للبيانات 
يبلغ بيتابايت لحفظ السجلات الطبية لعدد ٩‏ ملايين من الأفراد العسكريين. كما أن 012111 
أيضًا لديها مستودع بيانات بحجم jajal KE Ug Petabyte‏ المطلوب لأرشفة لقطات الأخبار. 

وبالنظر إلى أنَّ حجم مستودعات البيانات يتوسّع بمعدل (std‏ فإن القابلية للتطوير هي قضية 
مهمة. ويُقصَد بقابلية التوسّع الجيد أن الاستعلامات ووظائف الوصول إلى البيانات الأخرى 
(Yla Sio) gaitu‏ خطيًا مع حجم حجم المستودع. انظر: (2006) 1205626618 للتعرّف على طرق 
تحسين أداء الاستعلام. وفي الممارسة العملية» تم هّ تطويرٌ أساليب مُتخصّصة لإنشاء مستودعات 
بيانات قابلة للتطويرء غير أنَّ قابلية التوسّع terabytes coLza 8l! ue disuo‏ أو أكثر. فبيانات 
بحجم terabytes‏ تحتوي على قدر كبيرٍ من القصور الذاتي» وتحتلٌ الكثير من المساحة المادية, 

كما أنها تتطلّب أجهزة حاسب قوية. وتستخدم بعض الشركات المعالجة المتوازية لإدارة بياناتهم» 
في حين يستخدم oes Ji‏ الآخر الفهرسة الذكية وخطط البحث. كما يقوم البعض بنشر بياناتهم 
عبر مخازن البيانات الفعلية ال مختلفة. ومع اقتراب ال مزيد من مستودعات البيانات من حجم 
رطم يستمرٌ تطوير حلول أفضل وأحسن لقابلية التوسع. 

وقد عالج )2002( Hall‏ أيضًا قضايا قابلية التطوير وتُعَدُ شركة 87181 شركةً رائدةً في مجال 
نشر واستخدام مستودعات البيانات الضخمة؛ وقد استطاعت ۸١8١‏ اكتشاف الاحتيالية لاستخدام 
بطاقات الاتصال والتحقيق في المكالمات المتعلقة بعمليات الخطف والجرائم الأخرى؛ وذلك بفضل 
مستودع البيانات الذي تبلغ سعته 71 تيرابايت. كما أنها استخدمت القدرة على حساب ملايين 
أصوات الاتصال من مشاهدي التلفزيون الذين يختارون بطل برنامج Jil American Idol‏ 
وللحصول على عيّنة من تطبيقات مستودعات البيانات الناجحة: .Edwards (2003) : 3l‏ 489 
درس Jukic‏ و(2004) 1 الاتجاهات والقضايا المحدّدة المتعلقة باستخدام الموارد الخارجية في 
تطوير ودَّعُم مستودعات البيانات وتطبيقات ذكاء الأعمال. كما أشار (2003) هه:221 إلى أن 
الاستعانة مصادر خارجية في مجال تقنية المعلومات كانت تتزايد بمعدل ۲١‏ إلى ۲١‏ سنويًاء وعند 
النظر في نقل مشاريع مستودعات البيانات إلى الخارج؛ يجب النظر بعناية إلى الثقافة والأمن 
)25509 من التفاصيل انظر: 2004 -Jukic & Lang,‏ 
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أسئلة مراجعة على القسم V-V‏ 

-١‏ ما هي مهام تنفيذ 1010 الرئيسية التي يمكن تنفيذها بالتوازي؟ 

؟- اذكر مع الشرح المبادئ التوجيهية الأكثر دقة في تنفيذ 2117. 

al ga la -Y‏ المخاطر والقضايا التي يجب مراعاتهاء وربما تجنبها عند تطوير مستودع بيانات ناجح؟ 
ع- ما هي القابلية للتطوير؟ وكيف تطبّق IDW de‏ 


۸-۳ إدارة مستودع البيانات» والمشكلات الأمنيةء والاتجاهات المستقبلية: 
توفّر مستودعات البيانات $525 تنافسية متميزةً للمؤسسات التي تنش ئها وتس تخدمها 
بفاعلية. ونظرًا لحجمها الكبير وطبيعتها الجوهرية؛ فإنَّ مستودع البيانات يتطلب مراقبةٌ قويةٌ 
بشكلٍ خاصٌ؛ للحفاظ على كلّ من الكفاءة والإنتاجية المرضيتين. وتنطوي الإدارة الناجحة وإدارة 
مستودع البيانات على المهارات والكفاءة التي تتجاوز ما هو مطلوب من مسؤول قاعدة البيانات 
التقليدي (DBA)‏ ويجب أن يكون مسؤول مستودع البيانات (0۷4) متوافقاً مع تقنيات 
البرامج العالية الأداء والأجهزة والشبكات. كما يجب أيصًا أن تلك رؤية أعمال رائعة. وما 
كانت مستودعات البيانات تغذّي أنظمة ذكاء الأعمال و088 والتي تساعد المديرين في اتخاذ 
قرارتهم» وَجَبَ على مسؤول مستودع البيانات أن يكون على دراية بعمليات اتخاذ القرار لتصميم 
هيكل مستودع البيانات وصيانته بشكلٍ مناسب. ومن اللهمّ بشكل خاص أن يحافظ DWA‏ على 
المتطلبات والإمكانات الحالية لمستودع البيانات؛ في حين يوفر في الوقت نفسه مرونةٌ للتحسينات 
السريعة. وأخيراه يجب أن تمتلك 121854 مهارات اتصال ممتازة. وللحصول على وَصْف للاختلافات 
الأساسية بين 1184 و2184 James (2000)5 .Fadlallas -Benanders .Benander : 3l‏ 
i‏ أمان المعلومات وخصوصيتها من الاهتمامات الرئيسة والمهمة بالنسبة لمُستخدمي مستودع 
البيانات. وقد أصدرت الحكومة الأمريكية لوائح (على سبيل المثال: قواعد الخصوصية والضمان ل 
Gramm-Leach-Bliley‏ والتأمين الصحي وقانون ا مساءلة لعام ۱۹۹٩‏ [11۶44])» ووضعت 
متطلباتٍ إلزامية في إدارة معلومات العملاء. وبالتاي؛ يجب على الشركات إنشاء إجراءات أمنية فعالة 
ولكنها مرنة في الوقت ذاته لتتوافق مع العديد من أنظمة الخصوصية. ووفقًا لما ذكره كل من Elson‏ 
y ol case dil tLeClerc (2005)5‏ الأمان الفعّال في مستودع البيانات على أربعة مجالات رئيسية: 
-١‏ وضع سياسات وإجراءات أمنية فعّالة للشركات. ويجب أن تبدأ السياسة الأمنية الفعّالة من 
الإدارة التنفيذية العلياء وينبغي إبلاغٌ جميع الأفراد داخل ابلؤسسة. 
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-Y‏ تنفيذ إجراءات وتقنيات أمنية منطقية لتقيبد الوصول. وتتضمّن هذه الإجراءات التحقق من 
المستخدمء وعناصر التحكم في الوصولء وتقنية التشفير. 
- تقييد حرية الوصول إلى محيط مركز البيانات. 
-٤‏ إنشاء عملية مراجعة فعّالة للرّقابة الداخلية مع التركيز على الأمن والخصوصية. 
وسوف يتم تحديدٌُ تطورات مستودعات البيانات على المدى القريب؛ وذلك من خلال عوامل 
ملحوظة (مثل: حجم البيانات» وزيادة درجة التأهب لوقت الاستجابةء وتنوع وتعقيد أنواع 
البيانات) وعوامل أخرى أقل وضوحًا (مثل: متطلبات امستخدم النهائي التي م تستوف البيانات» 
وبطاقات الأداء المتوازن» وإدارة البيانات الرئيسيةء وجودة امعلومات). وفي ضوءِ هذه العوامل 
aS ed‏ اقترح js‏ من )2009( olAgosta (2006) » . Moseley‏ تعتمد اتجاهات مستودعات 
البيانات على البساطة. والقيمة. والأداء. 


مستقبل مستودعات البيانات: 

لقد كان مجال مستودعات البيانات مجالا حيويًا في مجال تقنية المعلومات في العقدين 
الأخيرينء وتبرهن الأدلة في عالم 81/84 والبيانات الضخمة أن أهمية المجال سوف تزداد فقط 
حتى تصبح أكثر إثارة للاهتمام. وفيما ياي بعض المفاهيم والتقنيات التي ظهرت مؤخرًا والتي 
ستلعب دورًا مهما في تحديد مستقبل مستودعات البيانات. 


الاستعانة بمصادر مختلفة (آليات للحصول على البيانات من مصادر متنوعة ومتفرقة): 

- شبكة الإنترنت» ووسائل التواصل الاجتماعيء والبيانات الضخمة: إن الطفرة الأخيرة في استخدام 
شبكة الإنترنت لأغراض شخصية إضافةً إلى الأعمال التجارية» إلى جانب الاهتمام الكبير بوسائل 
التواصل الاجتماعي يوفر فرضًا للمُحللين للاستفادة من مصادر بيانات غنية جدًا. وبسبب 
الحجم الهائل والسرعة وتنؤع البيانات؛ فقد ظهر مصطلحٌ جديدٌ لتسمية هذه الظاهرة. وهو 
مصطلح: «البيانات الضخمة». وللاستفادة من البيانات الضخمة؛ فإن الأمر يتطلب تطوير 
تقنيات 81/84 الجديدة والمحسّنة؛ مما سيؤدي إلى ثورة في عالم مستودعات البيانات. 


Sources: Compiled from Thornton, M., & Lampa, M. (2002). Hosted data warehouse. Journal of Data 
Warehousing, 7(2), 27-34; Thornton, M. (2002, March 18). What about security? The most common, but 


unwarranted, objection to hosted data warehouses. DM Review, 12(3), 30-43. 
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- برمجيات مفتوحة المصدر: يتزايدٌ استخدام أدوات البرمجيات مفتوحة المصدر إلى مستوى 
غير مسبوق في التخزينء وذكاء الأعمالء وتكامل البيانات. وهناك أسباب وجيهة للزيادة في 
البرمجيات المفتوحة المصدر المُستَخدّمة في مستودعات البيانات )2009 (Russom,‏ 123 
-١‏ أذَّى الركود إلى زيادة الاهتمام بالبرامج المفتوحة المصدر المنخفضة التكلفة. 
؟- وصلت الأدوات مفتوحة المصدر إلى مستوى أعلى في النضج. 
- تقوم البرمجيات مفتوحة المصدر بتقوية برامج المشاريع التقليدية دون استبدالها. 

- 5985 (كخدمة برمجية). «نموذج 450 الموسّع»: تُعَدُ 5835 طريقةً مبتكرةً لنشر 
تطبيقات أنظمة المعلومات؛ إذ يقوم مُوفر الخدمة مَِنْح العملاء ترخيصاً لاستخدام 
تطبيقاته عند الطلب لاستخدام تطبيقاته كخدمة عند الطلب (وعادةً ما يكون ذلك عبر 
الإنترنت). وتمكن مُورّدي برامج 5825 استضافة التطبيق على الخوادم الخاصة بهم أو 
تنزيل التطبيق إلى موقع المستهلك. والمضمون أن 5885 هي النسخة الجديدة والمحسّنة 
من نموذج 452. وبالنسبة لعملاء مستودع البيانات؛ فإن العثور على تطبيقات وموارد 
البرمجيات القائمة على 5385: والتي ib‏ الاحتياجات والمتطلبات الخاصة من الممكن 
أن يكون أمرًا صعبًا. ونظرًا لأن عروض هذه البرامج أصبحت أكثر مرونةٌ؛ فإن الاستعانة 
ب 5885 والاستخدام الفعلي لها كخيار لمنضّة مستودعات البيانات سوف يزداد أيضّاء 

- حوسبة سحابية: رها تكون الحوسبة الس حابية هي الخيارٌ الأحدث والأكثر إبداعًا في النظام 
الأساسي الذي سيأتي على مدار سنوات؛ إذ يتم تجميعٌ العديد من موارد الأجهزة والبرمجيات 
الافتراضية؛ بحيث يمكن تخصيصها بحرية للتطبيقات ومنصات البرامج عند الحاجة إلى الموارد. 
مما يتيح لتطبيقات أنظمة المعلومات أن ترتفع ديناميكيًا مع زيادة أعباء العمل. وعلى الرغم 
من أن تقنيات الحوسبة السحابية والتقنيات الظاهرية المشابهة معروفة جيدًا للتطبيقات 
التشغيلية اليوم؛ فإنها بدأت الآن في استخدامها كبرامج مستودع بيانات مختارة. فالتخصيص 
الفعّال للسّحابة يكون مفيداً بشكل خاص عندما يختلف حجم مستودع البيانات بشكلٍ غير 
متوقع؛ مما يجعل تخطيط السّعة Eao Gal‏ 1 

- بحيرات البيانات: مع ظهور البيانات الضخمة ظهر برنامج بيانات جديد يُسِمّى: بحيرة البيانات, 
وهو عبارة عن موقع تخزين كبير يمكنه الاحتفاظ بكميات هائلة من البيانات (والتي غالبًا ما 
تكون غير مهيكلة) في نَسَقها الأصلي/ الخام لاستهلاك التحليلات المستقبلية/ المحتملة. فبينما 
يقوم مستودع البيانات بمستودعات البيانات المنظمة؛ فإن بحيرة البيانات 0523 جميع أنواع 
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البيانات. في حين أن كليهما عبارة عن آليات لمستودعات البيانات؛ فمستودع البيانات يتمحور 
حول البيانات ا منظمة/ ا مجدولة. أما بحيرة البيانات تناسب جميع أنواع البيانات. وعلى الرغم 
من كثرة ما قيل وكُتب عن العلاقة بين الاثنين (بعض هذه الکتابات» وبعض ما قيل يوحي بأن 
بحيرة البياناتء هي الاسم المستقبلي لمس تودعات البيانات)؟ فإِنَّ بحيرة البيانات ليست بديلًا 
لمستودع البيانات؛ بل JS AG‏ منهما الآخر. وفيما يلي الفكرة التطبيقية ۲-۳ والتي نركز من 
خلالها على شرح بحيرات البيانات ودورها في مجال مستودعات البيانات والتحليلات التجارية. 


رؤية فنية :٠-۲‏ بحيرات البيانات: 


مع ظهور ظاهرة البيانات الكبيرة؛ ظهر مصطلحٌ جديدٌ وهو «بحيرة البيانات». ويعتقد 
الكثيرون أن بحيرة البيانات هي نفسها مستودع البيانات القديم؛ ولكن بشرط أن يكون 
جيدًا. ويشير الافتراض الأساسي إلى أن الطريقة القدهة طمستودعات البيانات لا تناسب 
(أولا تكفي) في عصر البيانات الكبيرة وبالتالي؛ فإن هناك حاجة إلى طريقة جديدة لتخزين/ إدارة 
البيانات؛ مما همد الطريق لبحررات البيانات. وعلى الرغم من أن معظمهم يعتقدون أن بحيرة 
البيانات هي الطريقة الُتلىء وأنها جاهزة لعمل قفزة كبيرة في مجال مستودعات ÓB OLLY‏ 
البعض الآخر له تحفُظات على استخدامها (ورها شك في جدواها). واصفاً إياها بأنها مستنقع. 


dS]‏ ما هي حقيقة بحيرة البيانات؟ 

إِنَّ بحيرة البيانات ببساطة هي موقعٌ تخزين كبيرٍ يمكنه الاحتفاظ بكميات هائلة من البيانات 
(مهيكلة أو غير مهيكلة أو شبه مهيكلة) بتنسيقها الأصلي/ الخام للاستخدام المستقبلي المحتمل. في 
حين أن مستودع البيانات لا يُخن إلا البيانات المنظمة في الجداول أو الملفات ol‏ ا مجلدات» كما أن 
بحيرة البيانات تستخدم بنيةً غير مُحدّدة ا معام (أيّ: غير مهيكلة) لتخزين جميع أنواع البيانات. 
وتتمثل القواسم المشتركة الرئيسية بين بحيرة البيانات ومستودع البيانات في أنَّ كلا منهما يُعَدُ آليات 
لمستودعات البيانات» وعلى العكس؛ فإن الاختلاف الرئيسي هو أن مستودع البيانات يتعَلّق بالبيانات 
ا منظمة / المجدولة في حين أن بحيرة البيانات تتعلق بجميع أنواع البيانات (مثل: البيانات الكبيرة). 

على الرّغم من أن تعريف بحيرة البيانات يتغيّر بين علماء البيانات؛ فإِنَّ التعريف الأكثر 
Glas ul‏ هو CTO s Pentaho à$,5 (s. 155 James Dixon cà s3‏ والذي ارتبط اسمه 
بمصطلح بحيرة البيانات. وفيما يلي الطريقة التي يَصف بها (2010 ,ههذ) بحيرة البيانات؛ 
إذ يقول: إذا كنت تفكر في سوق البيانات كمخزن للمياه المعبأة - من حيث تنظيفها وتعبئتها 
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وتنظيمها لسهولة الاستهلاك - فإنَّ بحيرة البيانات عبارة عن مجموعة كبيرة من المياه في حالة 
طبيعية» وتدفق إليها ا محتويات من أحد المصادر بملء البحيرة وفي هذه الحالة يمكن لمستخدمي 
لبحيرة المتنوعين ن يفحصوها أو يغوصوا فيهاء أو حتى يأخذوا عينات منها. 

ولعلٌ أفضل طريقة لتوصيف بحيرة البيانات؛ هي مقارنتها بمستودع بيانات في جدول مُتعدّد 
الأبعاد. وفيما يلي الجدول (-1) وهو عبارة عن جدول ملخص (يتبعه وصفٌ 3:53( sl SU‏ الأكثر 
شيوعًا لعمل مقارنة بين بحيرة البيانات ومستودع البيانات )2015 .(Dull, 2016; Campbell,‏ 


جدول -Y‏ مقارنة بسيطة بين مستودع البيانات وبحيرة البيانات 





البعد مستودع البيانات بحيرة البيانات 
طبيعة البيانات أي بيانات أصلية / أولية 
كك ا 
سرعة الاسترجاع المخطط على القراءة (:2505©1) 
mm‏ بطي Gin aS io‏ 
الحداثة/ الخبرة جديد جداً/ ناضج 
الان miot) sramoti]‏ 














طبيعة البيانات: يقوم مستودع البيانات بمستودعات البيانات التي تمّ تصميمها/ تجميعها/ 
هيكلتها فقط؛ في حين ol‏ بحيرة البيانات تقوم بتخزين كافة أنواع البيانات المهيكلة» وشبه 
ال مهيكلة؛ إضافةٌ إلى غير المهيكلة بتنسيقها الأصلي/ الأوَّلي. 

المعالجة: قبل تنزيل البيانات في مستودع البيانات؛ نحتاجٌ Haas Ki klas! JI Ío‏ 
أيْ: إننا نحتاجُ إلى وَضْعَ نموذج لها في المخطط النّجمي أو مخطط مجموعة الثلج وهو ما يُسمّى 
مخطط الكتابة. أمّا مع بحيرة البيانات؛ فإننا نقوم فقط بتنزيل البيانات الأوليةء كما هيء وعندما 
نكون مستعدين لاستخدام البيانات؛ فإننا نعطيها شكلا أو تصميمًاء وهو ما يُطلّق عليه مخطط 
القراءة. وهما طريقتان مختلفتان للغاية في المعالجة. 
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سرعة الاسترجاع: لأكثر من عقدين وهناك تطويرٌ مستمرٌ للعديد من القواعد الحسابية 
لتحسين سرعة استرجاع البيانات من مستودعات البيانات التي تتميّز بأنها مليئة وكبيرة. وتشمل 
هذه التقنيات المشغلات» والتمثيل العمودي للبيانات» ومعالجة قواعد البيانات. وحتى ÓE OII‏ 
عملية استرجاع البيانات (التي يُمكن أن تكون بأيّ شكلٍ أو أسلوبء بما في ذلك النضٌ غير المنظم) 
Élis i$‏ يتطلب DS Ég‏ 

تكلفة التخزين: dab‏ إحدى اللَيّزات الرئيسة لتقنيات البيانات الكبيرة مثل 1124007 هي أن 
تكلفة مستودعات البيانات منخفضة نسبيًا مقارنةً بمستودع البيانات» وهناك سببان رئيسان لذلك: 
- السبب الأول: م1180009 وهو برنامج مفتوح المصدر؛ ولذلك فإن الترخيص ودَغْم المجتمع مجاني. 
- السبب الثاني: 4 3( en uos tHadoop &uas‏ تثبيته على أجهزة السَّلع المنخفضة التكلفة. 

المرونة: بالتعريف يُعَنُ مستودع البيانات مستودعًا منظمًا للغاية. وليس من الصعب Ga‏ 
تغيير بنيته؛ ولكن قد يستغرق هذا الأمرُ وقنًا طويلًا؛ نظرًا لجميع العمليات التجارية المرتبطة به. 
ومن ناحية أخرى؛ فإِنَّ بحيرة البيانات تفتقرٌ إلى بنية مستودع البيانات؛ مما يعطي علماء البيانات 
والمُطوّرين القدرة على تهيئة نماذجهم وطلباتهم وتطبيقاتهم بسرعة وإعادة تشكيلها. 

الحداثة/ الخبرة: كانت التقنيات المتوفرة في مستودع البيانات موجودةً منذ فترة طويلة. 
ومعظم الابتكارات التي حدثت تم إنجازها في العشرين إلى الثلاثين عامًا الأخيرة. ولذلك فإنه لا 
cades desi‏ في مستودعات البيانات» وإن وُحِدَ فهو قليلٌ جذًا (مع استبعاد التقنية اللازمة لتعبئة 
واستخدام «البيانات الكبيرة» داخل مستودع البيانات). وعلى الجانب الآخر؛ فإِنّ بحيرات البيانات 
pde‏ وتتقدم من خلال الابتكار والحداثة لتصبح هي التقنية السائدة لمستودعات البيانات. 

الأمان: نظراً لوجود تقنيات مستودع البيانات منذ عقود طويلة؛ فإنَّ القدرة على تأمين البيانات 
في مستودع البيانات أكبر بكثير منها في بحيرة البيانات. ومع ذلك؛ فإنه تجدر الإشارة إلى الجهد 
الكبير الذي يُبذْل الآن في مجال الأمان في صناعة البيانات الضخمة. ولا يتعلق الأمرُ بما إذا كان أمن 
بحيرات البيانات سوف يُلبّي متطلبات محترفي التحليلات وغيرهم من المستخدمين النهائيين» أم لا. 

المستخدمون: لقد كان شعار العالّم التحليلي لفترة طويلة؛ هو «تحليل وفهم الأعمال 
للجميع». وقد أنشأنا مستودع البيانات ووجّهنا الدعوة للجميع لاستخدامه؛ ولكن هل استخدموه 
بالفعل؟ والإجابة هي أن نسبة مَنْ استخدموه لا تتعَدّى 70-7١‏ فقط. هل بحيرة البيانات هي 
نفس صيحة مستودع البيانات؟ هل سنقوم بإنشاء بحيرة البيانات وندعو الجميع إلى استخدامها؟ 
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رها يحدث ذلك في المستقبل. آمّا في الوقت الحاللي؛ فإن بحيرة البيانات بوضعها الحالي» ومرحلة 
النضج التي وصلت إليها تُعَدُ هي الأنسب لعلماء البيانات. 
وباختصار؛ فإن بحيرة البيانات تختلف عن مستودع البيانات. فبحيرة البيانات ليست هي 
مستودع البيانات (كما اقترح البعض)» كما أنها ليست بديلًا له. فكلاهما مطلوبان ولذلك؛ فقد تمّ 
تحسينهما من أجل وسائط البيانات المختلفة والمهام/ الأغراض المتنوعة. ولذلك؛ فإن كلا الاثنين 
بحاجة إلى التعايش معًا في عالم التحليلات (على الأقل لفترة من الوقت حتى تصل بحيرات البيانات 
إلى مستوى من النضج يُحقّق ما وصلت إليه مستودعات البيانات من الجودة في الوقت الحاضر). 
والهدف هو تصميم واستخدام كل منهما بشكلٍ صحيح للمهامٌ التي يؤديها؛ بحيث يتم استخدام 
أفضل خيار للعملء والذي قد يكون مزيجٌ من مستودعات البيانات وبحيرة البيانات. 
البُنية التحتية (التصميم - الأجهزة والبرمجيات - التحسينات): 
- العمودية (طريقة جديدة لمستودعات البيانات والوصول إليها في قاعدة البيانات): إِنَّ نظام 
إدارة قواعد البيانات باستخدام الأعمدة الموجّهة (والمعروف أيضًا باسم قاعدة البيانات 
العمودية). هو نظام يقوم بتخزين جداول البيانات كأجزاء من أعمدة البيانات بدلا من 
أنها صفوف من البيانات (وهي الطريقة التي يستخدمها معظم 1128115). بمعنى 
أن تخزين قواعد البيانات يتم بشكلٍ عموديٌ؛ فهذه البيانات تُخرّنَ بواسطة أعمدة بدلا من 
الصفوف Cun)‏ يتم تخزينٌ كافة قَيّم عمود واحد Si‏ متتابع على ذاكرة القرص). ومثل 
هذا الهيكل يعطي نوعاً من التحكُم أكثر دقة في 8581/15. فهو يستطيعٌ الوصول إلى الأعمدة 
المطلوب الاستعلام عنها فقط دون أن يكون هناك اضطرارٌ إلى الوصول إلى كل أعمدة الصف؛ 
إذ يعمل بشكلٍ أفضل بكثير فيما يخص الاستعلامات التي تحتاج إلى نسبة صغيرة من الأعمدة 
في الجداول الموجودة بها؛ ولكنه يؤدي عمله بشكل أسوأ عندما تكون هناك حاجةٌ إلى أعمدة 
كثيرة؛ بسبب الجهد الزائد المطلوب لربط كافة الأعمدة معًا لتشكيل مجموعات النتائج. وعادةٌ 
ما تتعلق المقارنات بين مخططات بيانات الأعمدة الموجهة والصفوف الموجهة» بكفاءة الوصول 
إلى القرص الثابت؛ للقيام بتنزيل عمل مُحدّد (والذي يُعَن واحدًا من أكثر العمليات التي 
تستغرق وقتًا طويلًا في الحاسب). وبناءً على المهمة المطروحة: يمكن لأحدهما أن يتمتع بمزايا 
أكثر من الآخر. ويكون نظام الأعمدة الموجهة أكثر كفاءة عندما: 
-١‏ يجب حساب الإجمالي من خلال العديد من الصفوف؛ ولكن فقط للجموعة فرعية صغيرة؛ 
بحيث تكون هذه المجموعة أقل من إجمالي أعمدة البيانات؛ إذ إِنَّ قراءة هذه المجموعة 
الفرعية الأصغر من البيانات تكون أسرع من قراءة كلّ البيانات. 
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؟- يتم تزويدُ جميع الصفوف بقيّم جديدة من أحد الأعمدة في وقتٍ واحد؛ نظرًا لأن بيانات العمود 
يمكن كتابتها بكفاءة واستبدال بيانات الأعمدة القديمة دون لمس أي أعمدة أخرى للصفوف. 
في حين يكون نظام الصفوف الموجّهة أكثر كفاءةً عندما: 
-١‏ تكون أعمدة كثيرة من صف واحد مطلوبة في نفس الوقتء وعندما يكون حجم الصف صغيراً 
نسبيًا؛ بحيث يمكن استرداد الصف بأكمله باستخدام قرص واحد. 
Aa AtS o -Y‏ جديد إذا تمَّ توفير كافة بيانات العمود في نفس الوقت؛ إذ يمكن كتابة الصف 
بأكمله باستخدام قرصٍ واحد. 
وإضافة إلى ذلك؛ فإنه نظرًا لأن البيانات المخرَّنة في أحد الأعمدة تكون من نوع Šp aó‏ 
ذلك يفسح المجال بشكلٍ أفضل للضغط بمعنى أنه يتوفر مساحة كبيرة لتخزين بيانات الأعمدة 
الموجّهةء وهذه المساحة لا تتوفر في بيانات الصفوف الموجهة» ومثل هذا الضغط اللْحْكّم للبيانات 
من شأنه أنه يقلّل من حجم التخزين؛ مما يجعله أكثر البدائل التي تجد قب ولا من الناحية 
الاقتصادية متابعة التخزين في الذاكرة أو الحالة الصلبة. 
- مستودعات البيانات الفورية: تنطوي عملية مستودعات البيانات Je (RDW) à; gall‏ »855 
تجديد مستودع البيانات الموجود؛ وذلك من أجل تحديث البيانات الأكثر تكرارًا (ويكون ذلك 
تقريبًا في نفس الوقت الذي تصبح فيه البيانات متاحةً في قواعد البيانات التشغيلية). فهذه 
الأنظمة (أنظمة 11018) يمكنها الوصول إلى تحديث البيانات بشكل فوري تقريبًا؛ إذ يستغرق 
وقت استجابة البيانات عادةً من دقائق إلى ساعات. ومع انخفاض وقت الاستجابة؛ فإن تكلفة 
تحديث البيانات تزداد بشكل كبير. وهناك حاجة إلى التقدّم مس تقبلًا في العديد من المظاهر 
التقنية (بدءًا من اكتساب البيانات تلقائيًا وصولًا إلى أدوات البرمجيات الذكية) لجعل 1521187 
حقيقة واقعة بتكلفة معقولة. 
- أجهزة مستودعات البيانات (حلول الكل في واحد لدى 278): يتكوّن جهاز مستودع 
البيانات من مجموعة متكاملة من الخوادم» ووحدات التخزينء ونظام (أو أنظمة) التشغيلء 
وأنظمة إدارة قواعد البيانات» والبرمجيات المثبتة بشكل مُسبّقء واممثبتة من أجل مستودعات 
البيانات. ومن الناحية العملية؛ فإن أجهزة مستودع البيانات توفر حلولًا من أجل مستودع 
البيانات المتوسطة لدى سوق مستودع البيانات الكبيرة؛ إذ تقدّم أداءً منخفصٌ التكلفة على 
أحجام البيانات في نطاق من تيرابايت إلى نطاق البيتابايت. ويستخدم معظم مورّدي أجهزة 
مستودعات البيانات تصميمات معالجة متوازية كثيفة من أجل تحسين الأداء. وعلى الرغم من 
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أن معظم g‏ قواعد البيانات ومستودعات البيانات يوفرون الأجهزة في الوقت الحاضر غير 
أَنَّ الكثيرين يعتقدون أن تيراداتا كانت أول من قدَّم منتجًا يتمثل في جهاز لمستودعات البيانات 
التجارية. وأكثر ما يُلاحَظ حاليًا هو ظهورٌ حُرّمَ مستودعات البيانات؛ إذ يقوم المورّدون TAÍ,‏ 
برمجياتهم وقواعد بياناتهم كمنصّة لمستودعات البيانات. 
a Ld‏ ناحية مزايا أجهزة مستودع البيانات؛ فإنَّ التكلفة الإجمالية للحصول alas ule‏ 
منخفضةٌ للغاية, والتي تشمل تكاليف الشراء الأولية وتكاليف الصيانة المستمرة, وتكلفة تغيير 
السّعة مع نمو البيانات. كما تُشكَّل تكلفة الموارد اللازمة لمراقبة وضبط مستودع البيانات نسبة 
كبيرةٌ من إجمالي تكلفة الملكية وغالبًا ما تصل هذه النسبة XN]‏ وإضافةٌ إلى ما سبق؛ فإن 
أجهزة 214 تعمل على الحَدّ من إدارة العمليات اليومية وا متمثلة في التشغيل والإعداد والتكامل. 
ونظرًا لأن أجهزة مستودعات البيانات توفر حل المورد الواحد؛ فإنها تتجه إلى تحسين الأجهزة 
والبرامج بشكل أفضل داخل الجهاز؛ إذ يعمل هذا التكامل المموخّد على زيادة فرص الاندماج الناجح 
واختبار نظم إدارة قواعد البيانات (218215) والتخزين ونظام التشغيل عن طريق de‏ بعض 
مشكلات التوافق التي تنشأ عن الحلول التي يقدّمها مُورّدون مُتعدّدون. كما يوفر جهاز مستودع 
البيانات ad Bae Jail dla‏ المشكلة ومسار ترقية أبسط بكثيرٍ لكل من البرامج والأجهزة. 
- تقنيات وممارسات إدارة البيانات: تتضمّن بعض الاحتياجات الْلَخّة للجيل القادم من برنامج 
مستودع البيانات التقنيات والممارسات التي لا نفكّر فيها عمومًا على اعتبار أنها جزءٌ من النظام 
الأساسي؛ إذ يحتاجٌ العديدٌ من المستخدمين على وجه الخصوص إلى تحديث أدوات إدارة البيانات 
التي تعمل على معالجة البيانات؛ لتصبح صالحةً للاستخدام من خلال مستودع البيانات. ويحمل 
المستقبل نهوًا قويًا لإدارة البيانات الرئيسية (361031). ورغم كون هذا المفهوم جديداً نسبيًا غير 
آنه بالغ الأهميةء وسوف BSG‏ بشعبية كبيرة لعدّة أسباب» وتشمل ما يلي: 

(MDM) äpu) Oly öylə! J| إن المج ا محكم مع الأنظمة التشغيلية يحتاج‎ -١ 

؟- إن معظمّ مستودعات البيانات لا تزال تفتقرٌ إلى وظائف إدارة البيانات الرئيسية وجودة البيانات. 

؟- يجبٌ أن تكون التقاريرٌ التنظيمية والمالية دقيقةٌ ونظيفةً Gle‏ 

- تقنية معالجة قاعدة البيانات (وَضْع نظام الحلول الحسابية حيث تكون البيانات): تشيرٌ 
معالجة قواعد البيانات )55 UA‏ أيضًا تحليلات قواعد البيانات) إلى مدى التكامل الحسالي 
لتحليلات البيانات في مستودع البيانات. وبمجرد القيام بذلك؛ فإن البيانات والتحليلات تتكاملٌ 
لتصبح ضمن بيئة واحدة. فوجود كلا الاثنين في بيئة واحدة يزيد من كفاءة إجراء التحليل 
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الحسابي المكثف. واليوم تعتمدٌ العديدٌ من أنظمة اتخاذ القرارات على قواعد البيانات الكبيرة 
مثل تلك المُسِتخدّمة في الكشف عن الاحتيال على بطاقات الائتمان وإدارة مخاطر البنوك 
الاستثمارية؛ إذ تُستَخدّم هذه التقنية نظرًا لإظهارها Bus os‏ في الأداء يتفوق على الطرق 
التقليدية في بيئة اتخاذ القرارء والتي يش كل فيها الوقت عاملًا مهمًا. وتُعَدُ معالجة قواعد 
البيانات عمليةً معقدةً إذا ما قورنت بالطريقة التقليدية لإجراء التحليلات؛ إذ يتم نقل البيانات 
خارج قاعدة البيانات (وغالبًا ما تكون في شكل ملفات مُسَطَّحَة تتألف من صفوف وأعمدة) 
إلى بيئة تحليلية منفصلة 9l Statistica Data Miner 5l SAS Enterprise Modeler Jte)‏ 
)]BM SPSS Modeler‏ للمعالجة. 
ود المعالجة داخل قواعد البيانات أكثرَ منطقيةٌ بالنسبة لبيئات التطبيقات العالية 
الإنتاجية الفورية» والتي تتضمّن كَشْف الاحتيال. وسجل الائتمانء وإدارة المخاطرء ومعالجة 
ا معاملات» والتسعير وتحليل الهامشء والتجزئة الدقيقة المستندة إلى الاستخدام واستهداف 
الإعلانات السلوكيةء ومحركات التوصيةء مثل تلك التي تستخدمها مؤسسات خدمة العملاء 
لتحديد الإجراءات التالية الأفضلء ويتم تنفيذ ومعالجة البيانات داخل قاعدة البيانات على 
اعتبار أنها مَيْرْةء من قبل العديد من مُورُدي مستودعات البيانات الرئيسيينء بما في ذلك 
تيراداتا (دَمج قدرات È SAS analytics‏ أجهزة مستودعات البيانات).؛ 4BM Netezzas‏ 
Sybases EMC Greenplums‏ من بین البرامج الأخرى. 
- تقنية التخزين في الذاكرة (نقل البيانات في الذاكرة؛ حتى تتم المعالجة بشكل أسرع): تستخدم 
أنظمة قواعد البيانات التقليدية مثل 81083/15, محركات الأقراص الصلبة الفعلية لمستودعات 
البيانات بشكل مثالي لفترة طويلة من الوقت؛ إذ يقوم نظام إدارة قاعدة البيانات بتنزيل البيانات 
(أو أجزاء من البيانات) إلى الذاكرة الرئيسية عند طلب عملية متعلقة بالبيانات بواسطة أحد 
التطبيقات» ويعالجها. ويستجيب مرةً أخرى للتطبيق. وعلى الرغم من أن البيانات (أو أجزاء 
من aS (Obl‏ مؤقنًا في الذاكرة الرئيسية في نظام إدارة قاعدة البيانات؛ فإِنَّ موقع التخزين 
الأماسي يظل عبارة عن قرص مغناطيسي ثابت. وفي المقابل؛ فإن نظام قاعدة البيانات في الذاكرة 
يقوم بالاحتفاظ بالبيانات بشكلٍ دائم في الذاكرة الرئيسية. وعندما تُطلب عملية تتعلق بالبيانات 
بواسطة تطبيقٍ ما؛ فإن نظام إدارة قواعد البيانات يصل مباشرةً إلى البيانات ا موجودة بالفعل في 
الذاكرة الرئيسيةء ويعالجهاء ويستجيب مرةً أخرى للتطبيق الذي يطلبه. إِنَّ هذا الوصول المباشر 
إلى البيانات في الذاكرة الرئيسة يجعل معالجة أوامر البيانات أسرع بكثير من الطريقة التقليدية. 
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لذا؛ فإِنّ الفائدة الرئيسة للتقنية في الذاكرة (بل قد تكون الفائدة الوحيدة لها) تتمثل السرعة 
المذهلة التي تصل بها إلى البيانات. أمّا العيوب فتشمل: تكلفة الحصول على ذاكرة رئيسة 
كبيرة للغاية (فحتى لو تمّ الحصول عليها بتكلفة أقلء إلا أنه لا يزال هناك الكثيرٌ لتوفير ذاكرة 
رئيسية كافية لاحتواء جميع بيانات الشركة). إضافةً إلى الحاجة إلى إستراتيجيات معقدة لاستعادةٌ 
البيانات (لأن الذاكرة الرئيسية مُتقلّبة ويمكن محوها بطريق الخطأ). 

- نظم إدارة قواعد البيانات الجديدة: تتكوّن منضّة مستودع البيانات من عِدَّة مكونات أساسية, 
أهمّها نظام إدارة قواعد البيانات (28315). وَيُعَنٌَ ذلك أمرًا طبيعيا فقط؛ لأن نظام إدارة 
قواعد البيانات (128215) هو مُكوّن النظام الأساسي؛ إذ إِنَّ معظم العمل يجب إنجازه بغرض 
تنفيذ نموذج بيانات وتحسينه لأداء الاستعلام. ولذلك؛ فإنَّ نظام إدارة قواعد البيانات (DBMS)‏ 
هو المكان الذي يتوقع أن تحدث فيه العديدٌُ من ابتكارات الجيل التالي. 

- تحليلات مُتقدّمة: هناك طرق تحليلية مختلفة يمكن للمستخدمين اختيارها في أثناء انتقالهم 
إلى ما وراء الأساليب الأساسية المستندة إلى 01.4 والتحليلات المتقرّمة. إذ يختار بعضُ 
المستخدمين طرقًا تحليليةً dai fouito‏ على التنقيب في coL SUI‏ والتحليلات التنبؤية, 
والإحصاءات» والذكاء الاصطناعي» وما إلى ذلك. ومع ذلك؛ فمن الواضح أن غالبية ا مستخدمين 
يختارون الأساليب اممستندة إلى 1ا5Q.‏ وسواءً اعتمدوا على SQL‏ أم لا؛ فيبدو أن التحليلات 
المتقدّمة تُعَد من بين أهمٌ الأمور المبشّرة بنجاح مستودعات البيانات في الجيل التالي. 

ومن الواضح أن مستقبل مستودعات البيانات ملي بالوعود والتحَدّيات الكبيرة. وإذ إِنَّ عام 

الأعمال أصبح أكثر عالميةٌ وتعقيدً؛ فإن الحاجة إلى أدوات ذكاء الأعمال وأدوات استرجاع البيانات 

سوف تصبح أكثر من ذي قبل. كما يبدو أن أدوات وتقنيات تقنية المعلومات سريعة التحشّن 

تتحرك في الاتجاه الصحيح لتلبية احتياجات أنظمة ذكاء الأعمال المستقبلية. 


أسئلة مراجعة على القسم A-Y‏ 

-١‏ ما الخطوات التي يمكن للمؤسسة اتخاذها لضمان أمان وسرية بيانات العميل في مستودع 
البيانات الخاص بها؟ 

Hlg 5111/4 ما هي المهارات التي يجبٌ أن تتوفر في‎ -١ 

۴- ما هي التقنيات الحديثة التي قد تشكّل مستقبل مستودعات البيانات؟ وماذا؟ 
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٩-۳‏ إدارة أداء الأعمال: 


تنتهي العديدُ من تطبيقات مستودع البيانات بتطوير نظام إدارة أداء الأعمال (/820). 
ففي الأعمال والأدبيات التجارية؛ نجد أنَّ 8811 لديها عددٌ من الأسماء بما في ذلك إدارة أداء 
(CPM) SBi‏ وإدارة أداء المؤسسات (8234). وإدارة المشاريع الإستراتيجية (5834). وقد 
e‏ إنشاءٌ 0514 بواسطة شركة EPM glaas Uis .(gartner.com) gud! Jdol Garner‏ 
فهو مصطلحٌ hs‏ بعروض (23م0216.6) 02806 بنفس الاسم. وأمّا 5524 فهو المصطلح 
الذي تستخدمه 542 (54.6022). وفي هذا الفصل؛ يفل مصطلح le BPM‏ المصطلحات 
الأخرى؛ لأنه الأقدم والأكثر استخدامًا cele. JS‏ والوحيد الذي لا يرتبط ارتباطًا وثيقًا موفر الحل 
الواحد. ويشير مصطلح إدارة أداء الأعمال (8824) إلى طريقة سَيْر الأعمال والمنهجيات والمقاييس 
والتقنيات المُستخدّمة من قبل الشركات لقياس أداء الأعمال ومراقبتها وإدارتها. ويشمل ثلاثة 
مكونات رئيسية (2009 ,امع0016): 

-١‏ مجموعة من الإدارات المتكاملة في حلقة مغلقة. وعمليات التحليل (مدعومة بالتقنية) التي 

تتناول الأنشطة امالية» وكذلك الأنشطة التشغيلية. 

-Y‏ أدوات للشركات لتحديد الأهداف الإستراتيجية ومن ثَّمّ قياسٌ وإدارة الأداء في مقابل تلك الأهداف. 
*- مجموعة أساسية من العمليات» بما في ذلك التخطيط المالي والتشغيلي. والاندماج وتقديم التقاريرء 

والنمذجة» والتحليلء ورَصْد مؤشرات الأداء الرئيسية (16815) المرتبطة بالإستراتيجية التنظيمية. 


دورة 82231 المغلقة: 


ربما يكون أهمُ الاختلافات بين 8224 وأيّ أدوات وممارسات أخرى لذكاء الأعمال» هو التركيز 
على الإستراتيجية الخاصة به؛ إذ يشمل 8531 مجموعةً من العمليات المغلقة التي تربط 
الإستراتيجية بالتنفيذ لتحسين أداء الأعمال (انظر: شكل .)١1-8‏ ويُقصّد بالحلقة؛ أن الأداء الأمثل 
يتحقق من خلال تحديد الأهداف والغايات (أيْ: وَضْع إستراتيجية). وإنشاء مبادرات وخطط 
تحقيق تلك الأهداف (أيْ: خطة). ومراقبة الأداء الفعلي مقابل الأهداف والغايات (أَيْ: المراقبة)» 
واتخاذ الفعل المناسب للإصلاح (أيْ: الفعل والضبط). فالطبيعة المستمرة والمتكرّرة للدورة تعني 
أنَّ إكمال التكرار يؤدي إلى عملية جديدة ومُحسّنة (دعم الجهود المستمرة لتحسين العمليات). 
ونتناول في هذا القسم وَصّف هذه العمليات الأربع. 
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شكل *-11: حلقة مغلقة لدورة 18514 


-١‏ وَضْع الإستراتيجية: أين نريد أن نذهب؟ 

ei‏ الإستراتيجية بشكل عام, ll lil‏ عمل عالية المستوىء تشمل فترةٌ زمنيةً طويلةٌ 
(غالبًا عدة سنوات) لتحقيق هدف مُحدّد. وهي ضروريةٌ بشكل خاص في حالة وجود العديد 
من القيود (مدفوعة بأوضاع السوقء وتوفّر المواردء والتعديلات القانونية/ السياسية) للتعامل 
معها في طريقها نحو تحقيق الهدف. في حين تُعرّف الإ تراتيجية في إطار الأعمال التجارية بأنها 
فن وعلمٌ صياغة القرارات التي تساعد الشركات على تحقيق أهدافها. وبشكل أكثر تحديدًا؛ فهي 
عملية تحديد وتوضيح مهمة المنظمة ورؤيتها وأهدافها ووَضْع خطط (على مستويات مختلفة 
من الدقة - الإستراتيجية والتكتيكية والتشغيلية) لتحقيق هذه الأهداف. 

وعادةً ما يتمُ إنشاءٌ وتخطيط إستراتيجيات الأعمال من قبل فريق من المسؤولين التنفيذيين 
في الشركات (غالبًا يقود هذا الفريق المديرٌ التنفيذي)» ويقوم مجلس الإدارة بالموافقة عليها 
والتصريح بهاء ثم يقوم فريق إدارة الشركة بتنفيذها تحت إشراف كبار المسؤولين التنفيذيين. 
وتوفر إستراتيجية الأعمال اتجامًا عامًا للمؤسسة وَتُعَدُ أول وأهمٌ عملية في منهجية .BPM‏ 
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؟- الخطة: كيف تَصل إلى هناك؟ 

عندما يعلمٌ المديرون التنفيذيون ويقهمون ما (الأهداف, والأهداف التنظيمية)» سيكونون 
قادرين على التوصل إلى كيفية (وضع خطط تشغيلية ومالية مُفصّلة)؛ بحيث تجيبٌ الخطط 
التشغيلية والمالية عن سؤالين: ما هي التكتيكات والمبادرات التي سيتمٌ اتباعها لتحقيق أهداف 
الأداء المُحدَّدة في الخطة الإستراتيجية؟ وما هي النتائج المالية المتوقعة لتنفيذ التكتيكات؟ 

تعمل الخطة التشغيلية على ترجمة الأهداف والأهداف الإستراتيجية لمنظمة ما إلى مجموعة 
من التكتيكات والمبادرات المحدّدة جيدًا. ومتطلبات الم وارد» والنتائج المتوقعة لبعض الوقت في 
المستقبلء وعادةًٌ (ولكن ليس دائمًا) ما تكون هذه المدة عامًا. وتشبه خطة التشغيل في جوهرها 
خطة المشروع التي تمّ تصميمها؛ لضمان تحقيق إستراتيجية المؤسسة. وتشتمل معظم الخطط 
التشغيلية على مجموعة من التكتيكات والمبادرات. وأمّا مفتاح النجاح في التخطيط التشغيلي فهو 
التكامل. وتقود الإستراتيجية إلى التكتيكات» وتقود التكتيكات إلى النتائج. وبشكلٍ أساسي يجبٌ ربط 
التكتيكات والمبادرات المحدّدة في خطة تشغيلية بشكل مباشر بالأهداف والغايات الرئيسية في الخطة 
الإستراتيجية. وإذا لم يكن هناك ارتباطٌ بين تكتيك فردي وهدف أو أهداف إستراتيجية أو أكثر؛ فإنه 
ينبغي على الإدارة أن تتساءل عمًا إذا كان التكتيك والمبادرات المرتبطة به مطلوبةٌ فعلا على الإطلاق. 
وقد تمّ تصميمٌ منهجيات 8811 والتي ستناقش لاحقاً في هذا الفصل للتأكد من وجود هذه الروابط. 

Ol‏ عملية التخطيط ووَضْع الميزانية المالية لديها بنية منطقية تبدأ عادةٌ بتلك التكتيكات 
التي تُولّد شكلاً من أشكال الإيرادات أو الدخل. وتعتمدٌ القدرة على توليد الدخل في المنظمات 
التي تبيع السّلعَ أو الخدمات إِمّا على القدرة على إنتاج السّلع والخدمات مباشرة أو الحصول 
على الكمية المناسبة من السلع والخدمات للبيع. وبعد تحديد رقم الإيرادات؛ فإنه يمكن توليد 
التكاليف المرتبطة بتسليم ذلك المستوى من الإيرادات. وفي كثيرٍ من الأحيان؛ فإن ذلك يستلزمٌ 
مدخلات من عدة أقسام أو تكتيكات. وهذا يعني أنه يجب أن تتمّ هذه العملية بطريقة تعاونية 
وأن التبعية بين المهامٌ تحتاجُ أن يتم توصيلها وفهمها بوضوح. وإضافةً إلى المدخلات التعاونية؛ 
فإن المنظمة تحتاج أيضًّا إلى إضافة العديد من التكاليف العامة؛ فض لا عن تكاليف رأس المال 
المطلوب. وبمجرد دَمْح هذه المعلومات؛ فإنها تُوضّْح التكلفة بالتكتيك فضلًا عن المتطلبات 
النقدية والتمويلية لوضع الخطة موضع التنفيذ. 
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-Y‏ المراقبة/ التحليل: كيف نؤدي؟ 

من الضروري مراقبة أداء ا منظمة عندما تكون الخطط التشغيلية والمالية فَيْد التنفيذ. وينبغي 
أن يتناول الإطار الشامل لرصد الأداء قضيتين رئيسيتينء وهما: ما الذي يجب مراقبته» وكيفية 
مراقبته. ونظرًا؛ لآنه من المستحيل ملاحظة كلَّ شيء؛ فإن المنظمة تحتاج إلى التركيز على مراقبة 
قضايا مُحدّدة. وبعد أن تُحدّد المنظمة المؤشرات أو المقاييس التي يجب ملاحظتها؛ فإنها تحتاج 
إلى تطوير إستراتيجية لرَضّد تلك العوامل والاستجابة لها بفعالية. وغالبًا ما تُسمّى هذه المقاييس 
مؤشرات الأداء الرئيسية (أو KPIs‏ باختصار). وسوف نقدّم نظرةً عامة على عملية تحديد 
مؤشرات الأداء الرئيسة لاحقًا في هذا الفصل. وهناك موضوعٌ آخر له صلة باختيار ا مجموعة 
المثلى من مؤشرات الأداء الرئيسة وهو طريقة بطاقة نقاط التوازن, والتي سيتمٌ تغطيتها بالتفصيل 
لاحقًا في هذا الفصل. 
-٤‏ الفعل والضبط: ما الذي نحتاج إلى القيام به بشكل مختلف؟ 

وسواءً أكانت الشركة مهتمة بتنمية أعمالها أو حتى على الأقل بتحسين عملياتها؛ فإن جميع 
الإستراتيجيات تعتمد فعليًا على مشروعات جديدة كإنتاج منتجات جديدة أو دخول أسواق 
جديدة: أو اكتساب Mas‏ جُدد أو شركات جديدة: أو تبسيط بعض العمليات. وتتعامل معظم 
الشركات مع هذه المشاريع الجديدة بروح من التفاؤل بدلا من الموضوعيةء متجاهلةٌ حقيقة أن 
معظم المشاريع القائمة والمشاريع الجديدة تفشل. ولكن ما هي فرصة الفشل؟ من الواضح؛ أن 
ذلك يعتمد على £93 geli. (Slywotzky & Weber, 2007) & 5 Al‏ هوليود تضع نسبة احتمال 
للفشل حوالي dans JV‏ الشيء نفسه على عمليات الدّمج والاستحواذ. كما أن مشاريع تقنية 
المعلومات الكبيرة XV. Juze Jid‏ وبالنسبة للمنتجات الغذائية الجديدة؛ فإن معدل الفشل 
هو .۸٠١‏ أمًا بالنسبة للمنتجات الصيدلانية الجديدة؛ فإن نسبة احتمال الفشل أعلى من ذلك؛ 
فهي حوالي ./6١‏ وعمومًا فإن معدل الفشل لمعظم المشاريع القائمة أو المشاريع الجديدة Aag‏ 
ما بين ٠٠‏ و٠۸.‏ وبالنظر إلى هذه الأرقام؛ فإن الإجابة على سؤال «ماذا نحتاج أن نفعل بشكل 
مختلف؟» تصبح قضية حيوية. 

وتوضّح الحالة العملية *-0 كيف حققت منظمةٌ كبيرةٌ غير ربحية نتائج استثنائية عن طريق 
تحويل وتحديث بنية ذكاء الأعمال الخاصة بها مع أجهزة مستودعات البيانات في العصر الحديث. 
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حالة عملية 0-7 
۳ه تقوم بتحويل بنية ذكاء الأعمال التحتية 
وتحقق عائد استثمار بنسبة 2۳٤۷‏ في ثلاث سنوات 

تُعَنُ 1 ,44187 - وهي الرابطة الأمريكية للأشخاص المتقاعدين سابقًا - مجموعة 
ذات شأن وعضوية مرها الولايات المتحدة. تأسّست في عام 1908م من Ethel Lö‏ 
EE gag «Percy Andrus‏ متقاعدة من كاليفورنيا حاصلة على الدكتوراه. و 
Leonard Davis‏ مؤسس مجموعة المستعمرات 2م26 لشركات التأمين. وكما هو 
مُوضّح في موقع الويب الخاص بهم (068.مهة)؛ فإن الرابطة تعن منظمةٌ غير ربحية 
وغير حزبية» كما أنها منظمة رعاية اجتماعية تضم ما يقرب من ۲۸ مليون شخص؛ 
إذ تساعد الناس على تحويل أهدافهم وأحلامهم إلى إمكانيات حقيقية» كما تعرز 
ا مجتمعات المحليةء وتحارب من أجل القضايا المهمة للعائلات. مثل: الرعاية الصحية. 
والتوظيفء والآمن, والدخلء والحماية من سوء المعاملة المالية. 

تزايد الطلب على ذكاء الأعمال: 

في عام 7١٠٠م‏ أطلقت ال منظمة لأوَّل مرة مبادرة ذكاء الأعمال التي من شأنها أن 
تمركز المعلومات (تمتلك 448127 مكاتب في جميع الولايات الخمسين؛ إضافةٌ إلى مقاطعة 
كولومبيا)ء وقد تمكّن موظفوها مع توفر تحليلات حالية وملائمة ودقيقة ومرنة من: 

- ملاءمة الخدمات وعروض المنتجات للقاعدة العضوية والتوقعات. 

- تحسين ربحية الأعضاء والاحتفاظ بهم؛ وگسبهم. 

- حماية صورة العلامة التجارية ل 44185 من خلال إدارة العلاقات مع مزؤّدي 
الخدمات التابعين لجهات خارجية. 

وقد ساعدت هذه الرؤية ف تعزيز نجاح الرابطةء ومع هذا النجاح؛ جاءت كميات 
أكبر من البيانات وزيادة الطلب على التحليلات الجديدة. 

وبحلول عام 5١٠٠م:‏ واجه فريق ذكاء الأعمال PS Gaos‏ إذ مم يَعْد مستودع 
البيانات الخاص بهم - المستند على قاعدة بيانات .501 العلائقية من عاع062 - قادرًا 
على مواكبة الطلب؛ إذ شهد الفريق أكثر من ١‏ حالة فشل في تلك السنة. وقد كان 
هذا الأمر مكلقًا وغير مقبول. 
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وإضافة إلى ما سبق؛ فقد كان أداء النظام مصدر قلق رئيسي. is‏ لتزايد حجم 
البيانات» وتعّذر إكمال التنزيل اليومي إلى مستودع امستندات حتى الساعة Elina ٠:٠١‏ 
- وهو ما أثر على طول مدة انتظار الموظفين للتقارير. تقول بروني مديرة ممارسة ذكاء 
الأعمال. :AARP‏ «كان محللونا يقومون بإعداد تقرير, ثم الذهاب لتناول القهوة أو 
لتناول طعام الغداء ورها يحصلون على إلرّدء إذ! كانوا محظوظين» بحلول الساعة 0:٠١‏ 
مسا إن هذا الأمر كان غير مقبول؛ فقد كان النظام مشغولً للغاية في كتابة البيانات 
اليومية الجديدة لدرجة أنه مم يعط أيّ أهمية لعمليات القراءة التي قام بها ا مستخدمون». 

وم يتمكّن المحللون أيضًا من إنشاء استعلامات مُخصّصة دون تدخل لتقنية المعلومات. 
فعندما تلقّت تقنية المعلومات طلباً لنوع جديد من التقارير؛ كان على فريق ذكاء الأعمال 
تحسين الاستعلامات وإرسال نموذج تقرير مرةٌ أخرى إلى الطالبين للمراجعة. وتستغرق هذه 
العملية من بدايتها إلى نهايتها من أسابيع إلى شهور. وقد وجد الموظفون أخيرًا أنه من 
المستحيل عمل نسخة احتياطية من النظام كلّ ليلة بوجود أكثر من 1 تيرابايت من البيانات 
في مستودع البيانات. ولذلك؛ فقد اقتصرت التْسَحْ الاحتياطية على بضع جداول حرجة؛ مما 
جعل من الصعب على اللوظفين إنشاء خطة فعّالة لاستعادة القدرة على العمل بعد الكوارث. 

ووفقاً لبروني؛ فإن هذا الأمر إذا ترك دون Jo‏ فمن الممكن أن تؤثر هذه التصدّعات 
على عمل الرابطة. تقول بروني: «يوفر التحليل مقاييس أساسية مهمة لتقييم مدى 
تحقيق عضويتنا وأهدافنا الاجتماعية؛ فمن الضروري تمكين التحسين المستمر واتخاذ 
القرارات؛ لدعم احتياجات الأعضاء». 

إنشاء بيئة رشيقة لذكاء الأعمال: 


نظرًا لتطلّع فريق بروني إلى تحديث بيئة ذكاء الأعمال؛ فقد قاموا بتقييم خيارين, 
وهما: تحسين البيئة الحالية أو الانتقال إلى جهاز مستودع بيانات واحد. تقول بروني: 
«لقد وجدنا تكلفة كل خيار قابلة للمقارنة؛ ولكن الجهاز فقط هو الذي قَدَّم لنا 
نقلةً نوعيةً فيما يتعلق بالأداء الذي كنا نحتاجه. ومن بين الخيارين امختلفين اللذين 
درسناهماء استطاع جهاز مستودعات البيانات 27616228 181/1 أن يتفوق على الخيار 
الآخر؛ نظرًا لكونه أكثر أمانا؛ إذ إنه لم يتطلب من نموذج البيانات ضبطًا às‏ لمخازن 
البيانات الأخرى. وإضافةً إلى ذلك؛ فقد استطعنا تجربة الجهاز قبل شرائه لمعرفة 
حقيقة ما إذا كان بإمكانه فعْل كلّ ما نحتاج إليه أم لا؛ وذلك على الرغم من أن معظم 
البائعين لا يقدّمون هذا النوع من الخيارات وهو (تجربة الجهاز قبل الشراء)». 
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CÉS s59‏ المنظمة نموذج تطوير «سكروم» في بناء البيئة الجديدة, والذي يُستخدّم 
عادةٌ من قبل مُطْوّري البرامج؛ لتوفير إطار عمل يختصر دورات التطويرء كما أنه 
g ud‏ الوقت لتسويق طلبات ذكاء الأعمال. وتضيف بروني: «إن استخدام سكروم في 
مستودعات البيانات؛ هو شيءٌ جديدٌ لم يسمع به أحد؛ لكن المبدأ الأماسي الذي يقدّمه 
هو عملية مرنة وتكرارية تمكّننا من تحويل الاحتياجات التحليلية للمستخدمين بسرعة 
إلى تقارير تشغيلية تُظهر بيانات ذات معنى». 


وخلال ٩‏ أشهر من اقتناء الجهاز الجديد؛ قام الفريق بتحويل جميع النصوص 
والإجراءات من قاعدة بيانات أوراكل إلى جهاز مستودع البيانات eus IBM Netezza‏ 
حاليًا تنزيلٌ مصادر بيانات JS‏ من الحسابات الأساسية وبيانات العضوية (التي تتواجد 
في 18M D82‏ لقاعدة بیانات 2/05 والتي تعمل على (IBM System z el‏ وبيانات 
الموارد المالية والبشرية من قواعد بيانات أصغر أخرىء وبيانات تحليل وتجزئة الحملات 
من بيانات جهات خارجية في جهاز مستودع A IBM Netezza OLLI!‏ إذ يمكن 
الوصول إليها من خلال أدوات ذكاء الأعمال للمنظمة دون انقطاع. 

تشغيل استعلامات مُعفّدة في سرعة البرق: 

من حيث الأداء (والذي كان أكثر اهتمامات فريق ذكاء الأعمال إلحاحًا)؛ فإن إكمال 
تنزيل البيانات اليومية الآن يتم قبل الساعة 8:٠٠‏ صباحًاء وهو تحسن بنسبة 16٠١‏ 
كما أن إكمال التقارير التي كانت تستغرق دقائق من قبل للتشغيل أصبح يتم الآن في 
عدة ثوان» وهو تحسن بنسبة .1۷٠١‏ وفضلا عن ذلك؛ فقد ساعد اقتناء الجهاز أيضًا 
في ضغط حجم البيانات من 1 تيرابايت إلى ١,0‏ تيرا بايت فقط؛ مما يتيح لفريق العمل 
الاحتفاظ بنسخة احتياطية من مستودع البيانات في ١‏ دقيقة فقط. 

وعلى نفس القدر من الأهمية؛ فإن ما يقرب من ۲۲١‏ من موظفي الموارد البشرية. 
وامالية والتسويقء إضافةً إلى موظفي الحملة الذين يستخدمون هذا النظام؛ يمكنهم 
الآن إجراء ما تشير إليه بروني بأنه «تحليل تدريب الفكر»؛ بمعنى إنشاء تقارير 
مُخصّصة لاختبار النظريات المتعَلّقة باحتياجات العضوية. وتقول بروني: «إن جهاز 
مستودع البيانات 7116228 /181 يشبه قيادة سيارة فيراريء لقد فتحنا عانًاً جديدً! من 
الإمكانيات لعملائنا الداخليين الذين يمكنهم فعلًا إنشاءٌ تقارير على الور والحصول 
على النتائج في غضون ثوانٍ معدودة. وقد شهدنا ارتفاعًا كب را في عدد التقارير التي 
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تم إنشاؤها في الأشهر القليلة الأولى من التشغيل؛ أي ما يقرب من ثلاثة أضعاف الرقم 
الذي كنا قد أيّدناه من قبل. وإضافةً إلى الغوص العميق الذي يمكنهم القيامُ به الآن؛ 


فقد شهدنا 15 ثابثًا في عمليات تجديد العضويات واكتساب أعضاء جدد. والمشاركات». 

تحقيق عائد الاستثمار السريع: 

كما مكّن النظامٌ الأماسي الجديد المنظمة من إعادة نشر موظفي دَعْم تقنية 
المعلومات من مجموعة ذكاء الأعمال إلى مناطق أخرى. فقد كان الفريق في السابق 
بحاجة إلى مسؤول قاعدة بيانات بدوام كامل (284) إلى جانب دَعْم جزئي من شبكة 
منطقة التخزين الخاصة باممنظمة (54۸) وفرق الخدمة المتوسطة. تقول بروني: «إنه 
لأمرٌ مدهش b‏ نَعْد بحاجة إلى دعم تقنية المعلومات؛ إذ يتخ شَحْن جهاز مستودع 
البيانات Netezza‏ 181/1 بالفعل. فقط امنحه القوة. واعطه شبكة. وبفعل ذلك فقد 
انتهي الأمرء ولا يحتاج أي شيء آخر». 





وقد منت هذه التحسينات المؤسسة من تحقيق عائد استثماري بنسبة 4“ في 
السنة الأولى» مح عائد استثمار متوقع بنسبة ۲۷٤‏ في السنة الثانيةء واستثمار بنسبة 
۷ بحلول السنة الثالثة. تقول بروني: «لقد أظهر تحليلنا الأوّبي عائد استثمار إيجابي 
في العام الأولء وهو أمرٌ غير مألوف أبدًّا بالنسبة لتحديث البنية التحتية؛ نظرًا إلى أن 
جميع التكاليف غير متكررة في السنة الأولى. ولقد كان التنفيذ الفعلي لمعدل العائد 
على الاستثمار أعلى من ذلك؟ أنهينا عملية المقايضة قبل ثلاثة أشهر من الموعد المحدد». 

توسيع تأثير ذكاء الأعمال: 

لقد أدرك فريق بروني القيمة العالية لذكاء الأعمال في المنظمة من خلال تحديث 
بنيته التحتية. تقول بروني: «بعد أن انتقلنا إلى 57616222 /181]؛ انتشر الكلام بأننا كنا 
نفعل الأشياء بشكلٍ صحيح. وأن الاستفادة من الخدمة الداخلية كانت ذكية للغاية؛ لقد 
اكتسبنا مجالات حيوية جديدة للمهمة, مثل منطقة التأثير الاجتماعي التي تدعم حملاتنا؛ 
من أجل القضاء على الجوع» وإنشاء حملات جيدة تستند إلى حقيقة أن لدينا بنية تحتية 
قوية. وإضافةً إلى ذلك؛ فقد غيّرنا منهجنا في العمل؛ إذ يمكننا التطوير بطريقة أكثر مرونةً, 
هذا من ناحية التنمية. أمَّا من ناحية إدارة البرنامج؛ فإنها تقلّص دورات إطلاقنا من 
أشهر - والتي تتناسب مع البُنَى التحتية التقليدية لبرمجيات البيانات - فقط لعدة أسابيع. 
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أسئلة للمناقشة: 

-١‏ ما هي التحَدَّيات التي تواجهها الرابطة؟ 

-١‏ ماذا كان النهجٌ المتّبع من أجل وَضْعِ حل ممكن؟ 

“- ما هي النتائج التي تمّ الحصول عليها على المدى القصير؟ وماذا كانت الخطط المستقبلية؟ 
Source: IBM customer success story. (2011). AARP transforms its business‏ 
intelligence infrastructure—Achieving a 34796 ROI in three years from BI‏ 


modernization effort. http://www-03.ibm.com/soft-ware/businesscasestudies/us/en/ 


corp?synkey-A735189Y23828M82 (accessed June 2016). 


أسئلة مراجعة على القسم 7-: 

-١‏ ما هي إدارة أداء الأعمال؟ كيف ترتبط بذكاء الأعمال؟ 

-Y‏ ما هي المكونات الرئيسية الثلاثة لنظام 8221؟ 

۳- اذكر المراحل الأربع لدورة BPM‏ وصفها بإيجاز. 

IU -£‏ 35 الإستراتيجية هي الجزء الأكثر أهميةً من تنفيذ 58521 


٠١‏ مقياس الأداء: 

إن نظام 811 هو نظامٌ لقياس الأداء. ووفقًا مما ذكره (2002) lS Simons‏ نُظُّم قياس الأداء؛ هي: 
«مساعدة المديرين في متابعة تنفيذ إستراتيجية الأعمال؛ من خلال مقارنة النتائج الفعلية بالأهداف 
والغايات الإستراتيجية» وعادةً ما يشتمل نظام قياس الأداء على طرق منهجية لتحديد أهداف العمل 
مع تقارير ردود الأفعال الدورية التي تشير إلى التقدم في تحقيق الأهداف» (ص .)٠١۸‏ 

الجديرٌ بالذكر أن كل أنظمة القياس تدور حول المقارنات. ونادرًا ما تكون الأرقام الأوّلِية ذات 
قيمة. فإذا تم إخبارك بأن أحد مندوبي المبيعات قد أكمل “0٠‏ من الصفقات التي كان يعمل عليها 
خلال شهر واحد؛ فلن يكون لذلك أي معنى يُذْكر. ولنفترض الآن أنه تمَّ إخبارك بأن الشخص نفسه 
الذي قام بالمبيعات لديه معدل إغلاق شهري بنسبة “٠‏ في العام الماضي. فالظاهر أن هذا الاتجاه 
جيد. ولكن ماذا لو تمّ إخبارك أيضَّا بأن معدل الإغلاق اليومي لجميع مندوي المبيعات في الشركة 
كان EU pals gög SA‏ أن مندوب مبيعات معين يحتاج إلى زيادة السرعة. وكما يُوحي تعريف 
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98 لقياس الأداء؛ فإن المقارنات الرئيسية تدور حول الإستراتيجيات والأهداف والغايات. 
oleg‏ ما تُسمّى المقاييس التشغيلية المُستخدّمة لقياس الأداء. مؤشرات الأداء الرئيسية (KPIS)‏ 


مؤشر الأداء الرئيسي (۲1): 
هناك اختلاف بين مقياس «تشغيل مصنع» ومقياس «الانحياز الإستراتيجي»» وغالبًا ما يُستخدّم 

مصطلح مؤشر الأداء الرئيسي (151) للدلالة على ا لمصطلح الأخير (الانحياز الإستراتيجي). يمثل 

مؤشر الأداء الرئيسى هدقًا ral al‏ ويقيس الأداء مقارنةً بالهدف. ووفقًا ما ذكره Eckerso‏ 

(2009)؛ فإن مؤشرات الأداء الرئيسة تكون متعددة الأبعاد. تحمل عدَّة معان وهذا يعني أن 

مؤشرات الأداء الرئيسة Bde lg)‏ مميزات متنوعة وتتضمّن: 1 

- إستراتيجية: حيث تجسّد مؤشرات الأداء الرئيسة هدقًا إستراتيجيًا. 

- أهداف: فمؤشرات الأداء الرئيسية تقوم بقياس الأداء مقارنةٌ بالأهداف المُحدّدة؛ إذ يتم تحديد 
الأهداف في الإستراتيجية أو التخطيط أو جلسات الميزانية» ويمكن أن تتخذ أشكالًا مختلفة (على 
سبيل اللثال: أهداف الإنجازء وأهداف التخفيضء والأهداف المطلقة). 

- مجالات: حيث تحتوي الأهداف على مجالات أداء (على سبيل المثال: أعلى من الهدفء أو في 
صميم الهدفء أو dol‏ من الهدف). 

- ترميز: حيث يتم ترميز المجالات في البرامج؛ مما يتيح العرض المرئي للأداء (على سبيل المثال: 
الأخضر, والأصفر, والأحمر). ويمكن أن يرتكز الترميز على النْسَب المئوية أو القواعد الأكثر تعقيدًا. 

- الأطر الزمنية: حيث يتم تعيينُ أطر زمنية للأهداف التي يجب إنجازها. وكثيرا ما يتم تقسيم 
الإطار الزمني إلى فواصل زمنية أصغر؛ من أجل الحصول على نقاط ميل منحنى الأداء. 

- المعايير: يتم قياس الأهداف وفقًا لخط الأساسء أو المؤشر المرجعي. وغالبًا ما تكون نتائج العام 
السابق ثابة معيار» كما هكن أيصًا استخدام أرقام عشوائية أو مؤشرات خارجية. 





Sources: Campbell, C. (2015). Top five differences between data lakes and data warehouses. www. 
blue-granite.com/blog/bid/402596/Top-Five-Differences-between-Data-Lakes-and-Data- Warehouses 
(accessed July 2016); Woods, D. (2011, July). Big Data requires a big, new architecture. Forbes.www.forbes. 
comf/sites/ciocentral/2011/07/21/big-data-requires-a-big-new-architecture/1598623291d75 (accessed 
August 2016); Dixon, J. (2010). Pentaho, Hadoop, and data lakes. James Dixon's Blog.https://jamesdixon. 
wordpress.com/2010/10/14/pentaho-hadoop-and-data-lakes/(accessed August 2016); Dull, T. (2016). 
Data lake vs data warehouse: Key differences. KDnuggets.com. http://www.kdnuggets.com/2015/09/data- 
lake-vs-data-warehouse-key-differences.html (accessed August 2016). 
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في بعض الأحيان يتم التمييرٌ بين مؤشرات الأداء الرئيسة التي يُقصّد بها «النتائج» وتلك التي 
يُقصَد بها «الدوافع»؛ فنتائج مؤشرات الأداء الرئيسة - التي تُحرّف أحيانًا بمؤشرات التباطؤ - تقيس 
النتائج التي وصل إليها النشاط السابق (مثل: الإيرادات). فهي في الغالب مالية بطبيعتهاء غير 
أن هذا ليس بشكلٍ دائم. وتُحدّد دوافع مؤشرات الأداء الرئيسة - والتي تعرف أحيانًا بالمؤشرات 
الرئيسة أو محركات القيمة - الأنشطة التي لها تأثيرٌ كبيرٌ على مؤشرات الأداء الرئيسة للنتائج 
(مثل: العملاء المحتملون للمبيعات). 
allis‏ على مؤشرات الأداء الرئيسية (1515) في بعض الدوائر أحيانًا اسم 1515 التشغيلي» 
وهو من التناقض اللغوي (2008 ,دء]18]). وتقوم معظمٌ المؤسسات بجمع مجموعة واسعة من 
امقاييس التشغيلية. وكما يوحي الاسم؛ فإن هذه المقاييس تتعامل مع الأنشطة التشغيلية وأداء 
الشركة. وتُوضْح الأمثلة التالية تنوع مجالات التشغيل التي تغطيها هذه المقاييس: 
- أداء العميل: مقاييس لرضا العملاء وسرعة ودقة حل المشكلة والاحتفاظ بالعملاء. 
- أداء الخدمة: مقاييس معدلات دقة اتصال الخدمةء ومعدلات تجديد الخدمة» واتفاقيات 
مستوى الخدمةء وأداء التسليم» ومعدلات الإرجاع. 
- عمليات المبيعات: حسابات جديدة على وشك الحدوثء واجتماعات المبيعات المضمونة, 
وتحويل الاستفسارات إلى العملاء المتوقعين» ومتوسط وقت إغلاق المكالمات. 
- خطة المبيعات/ التوقعات: مقاييس دقة أسعار الشراء. ونسبة الشراء إلى معدل التنفيذ 
والكمية ا محققةء ونسبة توقعات الخطةء وإجمالي العقود المغلقة. 
وسواءٌ أكان المقياس التشغياي إستراتيجيًا أم لا؛ فإن ذلك يعتمدٌُ على الشركة ومدى استخدامها 
للمقياس. وفي العديد من الحالات؛ فإن هذه المقاييس تمثل الدوافع الرئيسة للنتائج الإستراتيجية, 
فعلى سبيل المثالء تذكر (2008) ج5181 حالة موزّع نبيذ من الدرجة المتوسطة تم تقليصه في 
المراحل الأولى من خلال دمج الموزدين وتياره من خلال ذَمْج تجار التجزئة. ورذًا على ذلك؛ 
قزرت التركيز على أربعة إجراءات تشغيلية: تعزيز توفر المخزون المتاح/ في الوقت اللناسبء 
وقيمة الطلبات «المفتوحة» اللُعلّقة والحسابات الجديدة الصافيةء وتكاليف الترقية والعائد على 
الاستثمار في التسويق. وقد كانت النتيجة الصافية لجهودها زيادة بنسبة ×1١‏ في الإيرادات في 
عام واحد. ومن الواضح أن هذه المقاييس التشغيلية كانت مُحركات رئيسة. ومع ذلك؛ وكما 
m‏ مُوضّح في القسم التالي؛ فإن الشركات في كثير من الحالات» تقوم ببساطة بقياس ما هو ملائم 
مع الحدٌ الأدنى مع النظر في سبب جمع البيانات. وتكون النتيجة إهداراً للوقت والجهد والمال. 
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نظام قياس الأداء: 

يُوجَد فرق بين نظام قياس الأداء ونظام إدارة الأداء؛ إذ يشتمل الأخير (نظام إدارة الأداء) على 
الأول (نظام قياس الأداء). فأيّ نظام إدارة أداء يحتوي على نظام قياس أداء. والعكس غير صحيح. 
وإذا كنتَ ست سأل؛ فإن معظم الشركات اليوم تدعي أنها تمتلك نظامًا لقياس الأداء؛ ولكن ليس 
بالضرورة نظام إدارة أداء على الرغم من أن نظام قياس الأداء لا يُستخدّم إلا قليلاً جدًاء وإن وحِد؛ 
فيكون بدون الهيكل الشامل لنظام إدارة الأداء. 

dad‏ أنظمة قياس الأداء الأكثر شيوعًا المُستخدّمة. هي بعض أشكال بطاقة الأداء المتوازنة 
من صقاصة؟! و(850) 210:0. وتشيرٌ دراسات المقارنة والاستطلاعات المختلفة إلى أن نسبة 
الشركات التي نفذت شكلًا من أشكال 550 في وقت أو آخر تتراوح بين *0٠‏ إلى أكثر من 3١‏ في 
csl‏ مكان. وعلى الرغم من أن هناك بعض الغموض حول ما يُشكل (التوازن)» غير أنه Xi V‏ 
أدنى شك حول مُنشَئَيْ 850؛ وهما: مداه و(1996) 210005 واللذين ذكرا أن: «المركزية 
لمنهجية 850 هي رؤية شاملة لنظام القياس المرتبط باتجاه المنظمة الإستراتيجي. والتي تستند 
إلى أربع وجهات نظر من منظور العالم. مع تدابير مالية ذاتية» ومدعومة من قبل العملاء؛ إضافةٌ 
إلى مقاييس التعلّم والنمو». 


أسئلة مراجعة على القسم :٠١-‏ 

-١‏ ما هي نُظّم إدارة الأداء؟ ولماذا نحتاج إلى أحدها؟ 

TKPI هي السّمات المميّزة لمؤشرات‎ lo -Y 

"- اذكر مع التوضيح بإيجاز مجالات التشغيل الأربعة الأكثر شيوعًا لمؤشرات الأداء الرئيسية. 
©- ما هو نظام قياس الأداء؟ وكيف يعمل؟ 


١١-“‏ بطاقات الأداء المتوازنة: 

لعل أوسع أنظمة إدارة الأداء شهرةً وأكثرها استخدامًا على نطاق واسع؛ هو بطاقة الأداء 
.(BSC) olg zl‏ 489 أوضح oja Nortons Kaplan ¿ye js‏ المنهجية لأول مرة في مقالهما 
-المنشور في eY3Y ele Harvard Business Review‏ - وكان عنوان هذه المقالة: «بطاقة الأداء 
المتوازن: المقاييس التي تدفع الأداء». وبعد مرور بضع سنواتء وتحديدًا في عام 1997م, أصدر 
هذان المؤلفان كتابًا رائدًا بعنوان - بطاقة الأداء المتوازن: ترجمة الإستراتيجية إلى فعل - والذي 
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الفصل الثالث 


ونّق كيف كانت الشركات تستخدمٌ 8560 ليس فقط لتكمّل إجراءاتها المالية مع المقاييس غير 
AJU‏ ولكن أيضًا لتوصيل وتنفيذ إستراتيجياتها. وعلى مدى السنوات القليلة الماضية أصبحت 
550 مصطلحًا عامًا يُسِتَخِدَّم لتمثيل كل نوع من أنواع تطبيق الأداء والتنفيذ بغض النظر 
عمًا إذا كان متوازنًا أو إستراتيجيًا. وردًا على هذا الاختلاف حول المصطلح؛ فقد أصدر كلّ من 
هقامة؟؟ وده:ه1< كتابًا جديدًا في عام ١٠٠٠م:‏ بعنوان: المنظمة التي تركّز على الإستراتيجية: 
كيف تزدهر شركات بطاقات الأداء المتوازن في بيئة الأعمال الجديدة؛ وقد تمّ تصميم هذا الكتاب 
لإعادة التأكيد على الطبيعة الإستراتيجية لمنهجية 85©0. وتبع ذلك ببضع سنوات» في «Y^ ele‏ 
بخرائط الإستراتيجية: تحويل الأصول غير الملموسة إلى نتائج ملموسة: والتي تصف عملية 
مُفصّلة لربط الأهداف الإستراتيجية بالتكتيكات والمبادرات التنفيذية. وأخيرً؛ جاء كتابهم الأخير 
Älg <The Execution Premium‏ دشر YA ele d‏ ویرگز على الفجوة الإستراتيجية التي 
تربط بين صياغة الإستراتيجية والتخطيط والتنفيذ التشغيلي. 


وجهات النظر الأربعة: 
تشيرٌ بطاقة النتائج المتوازنة إلى أننا ننظر إلى المنظمة من أربعة منظورات» وهي: 
-١‏ العملاء. 
- العمليات اطالية. 
"- عمليات الأعمال الداخلية. 
ع- التعلم والنمو. 


إضافةً إلى تطوير الأغراض. وامقاييسء والأهدافء والمبادرات المتعلقة بكل منظور من هذه المنظورات» 
auis‏ الشكل ١-8‏ هذه المنظورات الأربعة وعلاقاتها المتداخلة مع رؤية المنظمة وإستراتيجيتها. 

- منظور العملاء: أدركت فلسفاث الإدارة الحديثة الأهمية الكبيرة للتركيز على العميل ومدى 
رضاه في أيّ عملٍ تجاري. وفيما يلي المؤشرات الرئيسة لقياس ذلك؛ فالعملاء إذا م يشعروا بالرضاء 
فإنهم في الواقع سوف يبحثون عن مورّدين آخرين هكنهم تلبية احتياجاتهم. وبالتالي؛ فإن الأداء 
الضعيف من هذا المنظور يُكَذَّ مؤشرًا GaS‏ على التراجع في المستقبل» على الرغم من أنَّ الصورة 
المالية الحالية قد تبدو جيدة. وفي تطوير المقاييس لتحقيق الرضا؛ ينبغي تحليل العملاء من 
حيث أنواع العملاء وأنواع العمليات التي pi‏ لها منتجًا أو خدمةً لتلك المجموعات من العملاء. 
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التحليلات الوصفية :)١(‏ ذكاء الآعمال ومستودعات البيانات 


- ا منظور المالي: م يتجاهل ds‏ من 5هآم 12 وه0غ2]0 الاحتياجات التقليدية للبيانات امالية. 
ولذلك؛ Glo dagl Ó‏ ستكون لتقديم بيانات التمويل بشكلٍ دقيق, وفي الوقت المناسب» 
وسوف يبذل المديرون كل ما في وسعهم لتوفير هذه البيانات. وفي الواقع؛ فإنه غالبًا ما يكون 
هناك أكثرٌ من معالجة كافية لتجهيز البيانات المالية. ومع تنفيذ قاعدة بيانات الشركات؛ فإنه 
من المنتظر أن تتمّ معالجة المزيد من البيانات المالية وبطريقة تلقائية. لكن تبقى هناك نقطة 
مهمة في هذا الأمرء وهي أن التركيرٌ الحالي على الأمور المالية يؤدي إلى الوَضْع «غير المتوازن» فيما 
يتعلق بالمناظير الأخرى. فقد تكون هناك حاجةٌ لإدراج بيانات إضافية مرتبطة بالقطاع المالي في 
هذه الفئةء مثل: بيانات تقييم المخاطر والفوائد من حيث التكلفة. 


- منظور التعلم والنمو: يهدف هذا المنظور إلى الإجابة عن سؤال «كيف سنحافظ على قدرتنا 
على التغيير والتحسين؛ من أجل تحقيق رؤيتنا؟». وهذا يتضمّن تدريب ا موظفين وإدارة المعرفة 
والخصائص الثقافية للشركات المتعلقة بالتحسينات الفردية والجماعية على حَذَّ سواء. وفي المناخ 
الحالي للتغ بر التقني السريع؛ أصبح من الضروري أن يكون العاملون في مجال ال معرفة في وضع 
التعلّم والتطور المستمر. ويمكن وَضْعِ مقاييس لتوجيه المديرين إلى تركيز الموارد المالية المخصصة 
للتدريب؛ إذ يمكنهم المساعدة أكثر. وعلى أية حال؛ فإن التعلم والنمو يشكّل الأساس الجوهري 
لنجاح أيَّ منظمة عاملة في مجال المعرفة. ويؤكد ÍS‏ من Gl Nortons Kaplan‏ «التعلم» أكثر 
من كونه «تدريباً» فهو إضافةٌ إلى التدريب يتضمّن أيضًا أشياء مثل وجود الموجُهين وا معلمين 
داخل المنظمة؛ إضافةٌ إلى سهولة التواصل بين العمال؛ مما ييسمح لهم بالحصول على مساعدة 
gl oles‏ مشكلة عند الحاجة إلى ذلك. 

- منظور عملية الأعمال الداخلية: ويركّز هذا المنظور على أهمية العمليات التجارية؛ إذ 
تسمح المقاييس التي تستند إلى هذا المنظور للمديرين بمعرفة مدى جودة تشغيل عملياتهم 
ووظائفهم الداخلية» وما إذا كانت نتائجٌ هذه العمليات (أيْ: المنتجات والخدمات) تلبِّي وتتجاوز 
متطلبات العملاء (المهمة). 
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شكل 1-8: أربع وجهات نظر في منهجية بطاقة النتائج المتوازنة 


معنى التوازن فى :BSC‏ 
من وجهة نظر عالية المستوى؛ فإن بطاقة الأداء المتوازن (850) تُعَنٌ مقياسًا للأداء ومنهجيةٌ 
إدارة تساعد في ترجمة الأوضاع المالية للمؤسسة: والعملاء. والعمليات الداخلية: إضافةً إلى 
أهداف RE‏ والنموٌ إلى مجموعة من المبادرات القابلة للتطبيق. وباعتبار بطاقة الأداء المتوازن 
(BSC)‏ منهجيةً للقياس؛ فقد تم تصميمها لتجاوز القيود ا مفروضة على الأنظمة التي تركّز على 
الناحية المالية. وتقوم هذه المنهجية بذلك عن طريق ترجمة رؤية المنظمة وإستاتيجيتها إلى 
مجموعة من الأهداف والتدابير والمبادرات امالية وغير امالية الترابطة. 
وتندرج الأهداف غير اطالية في واحدة من ثلاث وجهات نظر: 
- العميل: يُحدّد هذا الهدف كيف يجبٌ أن تظهر المنظمة لعملائها إذا أرادت تحقيق رؤيتها. 
- عملية الأعمال الداخلية: ويُحدّد هذا الهدف العمليات التي يجبٌ أن تتفوق فيها ا مؤسسة 
لإرضاء مساهميها وعملائها. 
els :‏ والنمو: يوضّح هذا الهدف كيف كن لمنظمة ما تحسين قدرتها على التغيير والتحسين؛ 
من أجل تحقيق رؤيتها. 
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وفي الأساس؛ فإن الأهداف غير المالية تشكّل duas‏ سببيةً بسيطةً مع «التعلم والنمو»؛ مما 
يؤدي إلى تغيير «عملية العمليات التجارية الداخلية»» والتي تنتج نتائج «العميل» وا لمسؤولة 
عن تحقيق الأهداف «المالية» للشركة. وفي ©1856 ينشأ مصطلح التوازن؛ لأن مجموعة التدابير 
مجتمعة من المفترض أن تشمل المؤشرات: 
- امالية وغير المالية. 
- الرائدة والمتخلفة. 
- الداخلية والخارجية. 
- الكمية والنوعية. 
- على المدى القصير والمدى الطويل. 


أسئلة مراجعة على القسم MY‏ 

33b ما هي بطاقة الأداء المتوازن (850)؟ ومن أين‎ -١ 

-Y‏ ما هي المناظير الأربعة التي تقترحها (850) لعرض الأداء التنظيمي؟ 

“- للماذا نحتاج إلى تحديدٍ مقاصد ومقاييس وأهداف ومبادرات منفصلة لكل من وجهات النظر 
الأربعة هذه؟ 

-٤‏ ما هو معنى التوازن في 85€؟ وما هو تحفيز ذلك التوازن؟ 

-٥‏ ما هي أوجه الشبه والاختلاف بين لوحات المعلومات وبطاقات الأداء؟ 


١1-9“‏ ستة سيجما كنظام لقياس الأداء: 

clås] dia‏ ستة سيجما في منتصف الثمانينيات» وهي تتمتّع بانتشار واسع النطاق بين الشركات 
في جميع أنحاء العالم. ومن الجدير بالذكر؛ أن معظم الشركات م تستخدمها كمنهجية قياس الأداء 
والإدارة؛ بل أستُخدمَتْ بدلا من ذلك كمنهجية لتحسين العمليات؛ إذ تكن الشركات من التدقيق 
في عملياتها وتحديد المشكلات وتطبيق العلاجات. وفي السنوات الأخيرة أقرّت بعض الشركات» 
Jia‏ 140105018 بقيمة استخدام ستة سيجما لأغراض إستراتيجية؛ إذ توفر ستة سيجما في هذه 
الحالة الوسائل لقياس ومراقبة العمليات الأساسية المتعلقة بربحية الشركة؛ وتسريع التحسّن في 
الأداء العام للأعمال. ونظرًا لتركيزها على العمليات التجارية؛ فإن ستة سيجما توفْر أيضًا طريقةٌ 
مباشرةٌ لمعالجة مشكلات الأداء بعد تحديدها أو اكتشافها. 
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الفصل الثالث 


lib Sigma (0) las a os‏ حرف في الأبجدية اليونانية يستخدمه الإحصائيون لقياس 
التباين في العملية. وفي مجال الجودة يكون التغيُر مرادفًا لعدد العيوب. وبشكل عام؛ فقد 
قبلت الشركات قدرًا كبيرًا من التباين في عملياتها التجارية. وأما من الناحية العددية؛ فقد كان 
المعيار 717٠١‏ إلى 7٠٠١‏ عَثْب لكلّ مليون (DPMO) oè‏ فعلى سبيل المثال: إذا كانت شركة 
تأمين تتعامل مع مليون شكوى؛ فإن إجراءات التشغيل العادية من 77٠١‏ إلى 71٠٠١‏ من هذه 
الشكاوى 55 معيبةٌ (أيْ: يتم التعامل معها بشكل غير صحيح» وتحتوي على أخطاء في النماذج). 
يمثل هذا المستوى من التباين مستوى أداء من ثلاثة إلى أربعة 2دمع51. ولتحقيق مستوى أداء 
Sigma diw‏ فإنه سيكون على الشركة تقليل عدد العيوب إلى ما لا يزيد عن ١,6‏ 122110. 
ولذلك؛ فإن ستة سيجما عبارة عن منهجية لإدارة الأداء تهدف إلى تقليل عدد العيوب في العمليات 
التجارية إلى أقرب ما يكون إلى الصفر من 12210 قدر الإمكان. 


نموذج الأداء :DMAIC‏ 


تقع ستة سيجما على نموذج بسيط لتحسين الأداء يُعرّف باسم 221410. ويشبه نموذج 

410 هذا موذج 8211؛ فكلاهما نموذج لتحسين الأعمال في حلقة مُفرّغة وهو يشمل 

خطوات تحديد وقياس وتحليل وتحسين والتحكّم في العملية. ويمكن وَصْف الخطوات على 

النحو التالي: 

-١‏ تعريف: axis‏ بذلك تحديد مقاصد وأهداف وحدود نشاط التحسين. وعلى المستوى الأعلى؛ 
فإن الأهداف يُقصّد بها الأهداف الإستراتيجية للشركة. وفي المستويات الأدنى (مستويات 
الإدارة أو المشروع)؛ فإن الأهداف تركز على عمليات تشغيلية مُحدّدة. 

؟- قياس: ويُقصَّد به قياس النظام الحالي. بمعنى وَضْعِ مقاييس كمية من شأنها أن نُسفر 
عن بيانات صحيحة إحصائيًا؛ بحيث يمكن استخدام البيانات؛ لمراقبة التقدّم نحو الأهداف 
المحدّدة في الخطوة السابقة. 

“- تحليل: ales 4; alis‏ النظام لتحديد سُبْل القضاء على الفجوة بين الأداء الحالي للنظام أو 
العملية والهدف المنشود. 

ع- تحسين: ويُقصَّد به الشروع في إجراءات للقضاء على الفجوة من خلال إيجاد طرق لفعل 
الأفياء بشكل أفضل وأسرع وأقل تكلفة. ويتمُ ذلك باستخدام إدارة المشاريع وأدوات 
التخطيط الأخرى لتنفيذ النَّهجٍ الجديد. 


Ya‏ ذكاء الأعمال والتحليلات وعلم البيانات. منظور إداري 


التحليلات الوصفية :)١(‏ ذكاء الآعمال ومستودعات البيانات 


ه- التحكّم: ويُقصّد بذلك إضفاءٌ الطابع المؤسسي على النظام بعد تعديله؛ من خلال تعديل 
أنظمة التعويض والحوافز والسياسات والإجراءات» وتخطيط موارد التصنيع وموارد الميزانيات 
وتعليمات التشغيل أو أنظمة الإدارة الأخرى. 
وبالنسبة للعمليات الجديدة؛ فإن نموذج 12214107 المُستخدّم ل (التعريفء والقياس» 

والتحليلء والتصميم. والتحقيق) يُعَدُ نموذجًا تقليديً. ولذلك؛ فقد تمّ استبداله ب ©23141 

غير أن 122141077 لا يزال يُُستخدّم في المقام الأول مع القضايا التشغيلية ومع ذلك؛ فلا شيء 
هنع تطبيق هذه المنهجيات. ففي السنوات الأخيرة» كان هناك تركيرٌ على الجمع بين منهجية 
ستة سيجما وغيرها من المنهجيات الناجحة. فمثلا؛ تم دَمْج المنهجية المعروفة باسم ”4ء1 
o Lean Production gÍ Manufacturing‏ ببساطة باسم 1.6382 مع ستة سيجما؛ لتحسين 
تأثيرها في إدارة الأداء. 


بطاقة الأداء المتوازن مقابل ستة سيجما: 


على الرغم من قيام الكثيرين بالجمع بين ستة سيجما وبطاقات قياس متوازنة؛ من أجل 
الحصول على حل أكثر شمولية؛ فإِنَّ بعضهم رز على تفضيل إحداها على الأخرى. وقد قدّم 
à Gupta (2006)‏ كتاب له بعنوان: « ستة سيجما 4نهء©:560 811512655» ملخصضًا جيدًا 
للاختلافات بين بطاقة الأداء المتوازنة ومنهجيات ستة سبجما (انظر: الجدول 8-/1). وباختصار؛ 
فإن الفرق الرئيس يتمثل في أن 8560 تركّز على تحسين الإستراتيجية العامة؛ في حين تركز ستة 
سيجما على تحسين العمليات. 


جدول -ل!: مقارنة بين بطاقة الأداء المتوازن وستة سيجما 





بطاقة قياس الأداء المتوازن ستة سيجما 


نظام الإدارة الإستراتيجية نظام قياس الآأداء 


تقدّم لقطة لأداء الأعمالء وتُحدّد التدابير التي 
تدفع الأداء نحو الرّبحية 


تتعلّق بالعرض الطويل الأجل للأعمال 


مُصمّمة لتحديد مجموعة من القياسات التي تؤثر 
على الرّبحية 


مُصمّمة لتطوير مجموعة متوازنة من التدابير 
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والرّبحية 


تشمل جميع العمليات التجارية: الإدارية 
والتشغيلية 


تُحدّد ال ممساءلة عن القيادة؛ من أجل الصحة 


تتمثل عمليات الإدارة الحاسمة في توضيح الرؤية/ 


بطاقة قياس الأداء المتوازن 
تُحدّد القياسات حول الرؤية والقيم 
الإستراتيجية» والتواصلء والتخطيطء وتحديد 


الأهداف» ومواءمة المبادرات الإستراتيجيةء وتعزيز 
التغذية المرتدّة 





أرصدة الإدارة وأدوار الموظفينء وأرصدة تكاليف 
وعائدات العمليات الثقيلة 

تؤكّد على مُعدَّل التحفيز القوي لكل قياس؛ بغ 
النظر عن تحقيق كمية المبيعات المُستهدّفة 

aS‏ على التعلم والابتكار على جميع المستويات 
zo‏ على التغذية المرتدّة. ويستلزم مشاركة جميع 


الموظفين 
تركز على تعظيم الرّبحية 


ضخمة عند التنفيذ للربحية 





نظام القياس على أساس إدارة العملية 





أرصدة العملاء والعمليات الداخلية دون دور 
pl‏ واضح المعالم 

تكد على تحقيق كمية مبيعات مُستَهدّفة لكل 
قياس 


تؤكّد على تعلّم المديرين التنفيذيين على أساس 
التغذية المرتدّة 

تركز على النمو 

ضخمة بالنسبة للمحتوى الإستراتيجي 


نظام إدارة يتكوّن من التدابير 








Source: Gupta, P. (2006). Six Sigma business scorecard, 2nd ed. New York: McGraw-Hill Professional. 


قياس الأداء الفعّال: 


a Sae på iy‏ الكتب الطرق التي تُحدّد ما إذا كانت مجموعةًٌ من مقاييس الأداء جيدةٌ أم 
سيئة. ومن بين الصفات الأساسية التي تميّز مجموعة مقاييس الأداء الجيدة ما يلي: 
- ينبغي أن تركّز المقاييس على العوامل الرئيسية. 
- يجب أن تكون المقاييس مزيجًا من الماضي والحاضر والمستقبل. 
- يجب أن ثوازن المقاييس بين احتياجات المساهمين والموظفين والشركاء والموردين وأصحاب 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


المصلحة الآخرين. 


FA 


التحليلات الوصفية :)١(‏ ذكاء الآعمال ومستودعات البيانات 


- يجب أن تبدأ الإجراءات من الأعلىء ثم تتدفق إلى الأسفل. 
- يحتاجُ القياس أن يكون له كمية مبيعات مس تَهدّفة (هدف يسعى إلى تحقيقه) والتي تستند 
إلى البحث والواقع وليست تعشّفية. 1 
كما ao‏ القسم المتعلّق بمؤشرات الأداء الرئيسية أنه على الرغم من أهمية جميع هذه 
الخصائص؛ فإن المفتاح الحقيقي لنظام قياس الأداء الفعّال هو وجود إستراتيجية جيدة. فيجبٌ 
اشتقاق المقاييس من إستراتيجيات وحدة الشركات والأعمالء ومن تحليل العمليات التجارية 
الرئيسية المطلوبة لتحقيق تلك الإستراتيجيات. وبطبيعة الحال؛ فالقول أسهل من الفعل. فلو 
كانت بسيطة؛ فإن معظم المنظمات لديها بالفعل أنظمةٌ AUS‏ لقياس الأداء غير أنها لا تقوم بذلك. 
وتقدّم الحالة العملية (1-۲) - والتي تصف نظام بطاقة الأداء على أساس 1281 المستند 
إلى !33 Expedia.com uL e c.‏ - 5,$ 235 4 على الصعوبات المتعلقة بتحديد Js‏ من نتائج 
ومؤشرات ۲1 وأهمية مواءمة مؤشرات الأداء الرئيسة للإدارات مع الأهداف العامة للشركة. 


حالة عملية ٠-۳‏ 
بطاقة درجة رضا Expedia.com 2 &ol3JÍ eXasJl‏ 

ke‏ شركة عم]آ ,01»م<8. هي الشركة الأم لبعض الشركات العاممية الرائدة في مجال 
السياحة؛ إذ تقدِّم خدمات السفر jl uso Da Saa‏ والمقر الرئيسي لهذه الشركة 
هو الولايات المتحدة الأمريكية» كما G‏ لها فروعًا أخرى في مختلف دول العالم. وهي 
تمتلك وتدير مجموعةً متنوعةٌ من العلامات التجارية Expedia. «U5 (à Us «335 sl‏ 
Classics .Egencias .TripAdvisors .Hotwire.comg .Hotels.coms «com‏ 
5 ومجموعة من الشركات المحلية والدولية الأخرى. وتحتوي عروض سفر 
الشركة على: رحلات شركات الطيرانء والإقامة في الفنادقء واستئجار السيارات» وخدمات 
أماكن الوصولء والرحلات البحريةء ورحلات السفر التي تقدّمها مختلف شركات الطيران؛ 
إضافة إلى أماكن الإقامةء وشركات تأجرر السيارات» والخدمات التي تَقَدُم في مكان 
الوصول» وخطوط الرحلات البحريةء وغيرها من شركات خدمات السياحة القائمة بذاتها 
أو التي تعمل في مجموعة. كما أنها تسيل حجز غرف الفنادق ومقاعد شركات الطيران 
وتأجير السيارات. وخدمات الوصول المقدّمة من الشركات السياحية. وتعمل هذه 
الشركة كوكيلٍ في الإجراءات؛ إذ تقوم بالحجز للمسافرين على شركة الطيران أو الفنادق 
أو شركات تأجير السيارات أو خطوط الرحلات. وتجعل هذه العلامات التجارية المشهورة 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري ۳۹ 


الفصل الثالث 


مع الأعمال التجارية المبتكرة من 6414م8 أكبر وكالة سفر عبر الإنترنت في العالمء وهي 
ثالث أكبر شركة سفر في الولايات المتحدة, ورابع أكبر شركة سفر في العالم. وتتمثل مهمثها 
في أن تصبح أكبرَ وأكثر شركة سياحية مريحةً في العالم؛ وذلك من خلال مساعدة الجميع 
في كلّ مكان في التخطيط وتوفير كلّ ما يتعلق بخدمات السياحة والسفر. 

ا مشكلة: 


fle S eh sa Mas Lay d s‏ وإستراتيجيات؛ بل وأساس نجاح شركة 
Expedia‏ ونظرًا daas OV‏ البيع بالتجزئة هي نشاطٌ تجاريٌ عبر الإنترنت؛ فإن تجربة 
تسوق العميل تُعَدُ أمرًا بالغ الأهمية لإيرادات شركة tExpedia‏ |8 إن تجربة التسوّق 
عبر الإنترنت يمكنها أن تجعل النشاط التجاري عبر الإنترنت يزدهر أو ينتهي» ومن امهم 
ol lá‏ توج تجربة التسوق للعميل برحلة جيدة. ونظرًا لأن تجربة العميل hal i‏ 
بالغ الأهمية؛ فإنه يجبُ تتبّع جميع مشكلات العملاء ومراقبتها وحلّها في أسرع وقتٍ 
ممكن. وللأسف؛ فقد كانت شركة 6012م:8 قبل بضع سنوات لا تستطيع الوصول إلى 
«رأي العميل». فلم يكن لديها طريقة موحّدة لقياس مدى رضا العميل, أو تحليل 
محركات الرضاء أو تحديد أثر الرضا على ربحية الشركة أو أهداف العمل العامة. 

الحل: 

لم تكن مشكلة شركة d Jis: Expedia‏ نقص البيانات. أدركت المجموعة المسئولة 
عن قياس مدى رضا العملاء في Jiss OBLI oo AIl p Ol Expedia åS‏ 
عام؛ فقد كان هناك ٠١‏ قاعدة بيانات متباينة مع ۲۰ مالگا مختلقًا. ومن ثمّ قامت 
المجموعة بتكليف أحد مُحَلَلِي أعمالها بمهمة تجميع البيانات من هذه المصادر المختلفة 
وتجميعها في عدد من المقاييس الأساسية لقياس مدى الارتياح. وقد كان محلل الأعمال 
يقضي ما يقرب من أسبوعين إلى ثلاثة أسابيع كلّ شهر في سحب البيانات وتجميعهاء 
وهذا الأمر مم يترك وقنّا للتحليل نهائيًا. ولذلك؛ فقد أدركت المجموعة في النهاية أن 
مجرد تجميع البيانات لم يكن كافيّ؛ إذ يجب أن يُنظر إلى البيانات في سياق الأهداف 
الإستراتيجيةء وكان يجب على الأفراد أن يضعوا أيديهم على النتائج. 

ومعالجة ا لمشكلة قرَّرت المجموعة أنها بحاجة إلى رؤية راقية. ولذلك فقد بدأت 
بتحليل مُفصَّل للدوافع الأساسية لأداء الإدارة والرابط. بين هذا الأداء وأهداف Expedia‏ 
الشاملة. ثم قامت المجموعة بعد ذلك بتحويل برامج التشغيل وهذه الارتباطات إلى 
بطاقة قياس أداء. وقد تضمّنت هذه العملية ثلاث خطوات: 


v‏ ذكاء الأعمال والتحليلات وعلم البيانات. منظور إداري 


التحليلات الوصفية :)١(‏ ذكاء الآعمال ومستودعات البيانات 


-١‏ تقرير كيفية قياس مدى رضا العميل: وقد تطلّب ذلك من المجموعة تحديد أي 
من المقاييس في قواعد البيانات العشرين سيكون مفيدًا في إظهار مستوى رضأ العميل, 
وقد أصبح هذا هو الأساس لبطاقات الأداء ومؤشرات الأداء الرئيسية. 

؟- تحديد أهداف الأداء الصحيحة: وهذا يتطلب من المجموعة تحديدّ ما إذا 
كانت أهداف 121 لها أرباحٌ قصيرة الأجل أو طويلة الآجل؛ فمجرد رضا العميل عن 
تجربته عبر الإنترنت لا يعني بالضرورة أن العميل راضٍ عن مُقدَّم خدمة السفر. 

۴- وضع البيانات في السياق: فقد كان على المجموعة رَبْط البيانات بمدى رضا 
العملاء في الوقت الحالي. 

وتم تغذية مصادر البيانات المختلفة بشكل فوري في قاعدة بيانات رئيسية (تُسمّى 
نظام دعم القرار). وفي حالة مجموعة الاستبيانات الخاصة بمدى رضا العملاء؛ فإن هذه 
الاستبانات تتضمّن استطلاعات العملاء. وأنظمة إدارة علاقات العملاء. وأنظمة الاستجابة 
الصوتية التفاعليةء وأنظمة خدمة العملاء الأخرى. ويتمٌ تنزيل البيانات في مصنع 7255 
بشكل يوميّ في صورة عِدَّة مكعبات 12/5 متعددة الأبعاد؛ بحيث يمكن للمستخدمين 
الوصول إلى البيانات بطرق متنوعة ذات صلة باحتياجاتهم التجارية الخاصة. 

الفوائد: 

وفي نهاية المطاف استطاعت المجموعةٌ الخاصة من خلال قياس مدى رضا العملاء؛ 
أن تحقق من ٠١‏ إلى 17 هدقًا ترتبط مباشرةً بمبادرات شركة إكسبيديا. وقد تمَّ رَبْط هذه 
الأهداف بدورها بأكثر من 200 1281 ضمن المجموعة الخاصة بقياس مدى رضا العملاء. 
يستطيع مالكو 121 بناء وإدارة واستهلاك بطاقات الأداء الخاصة بهم كما يملك المديرون 
التنفيذيون ومديرو الإدارة رؤيةٌ شفافةٌ حول مدى توافق الإجراءات مع الإستراتيجية. كما 
توفر بطاقة النتائج للمجموعة الخاصة بقياس مدى رضا العملاءء القدرةٌ على التعمّق في 
البيانات التي تكمُّنْ وراء أي من الاتجاهات أو الأنماط الملاحظة. Ss‏ هذا كان يستغرق 
في الماضي أسابيع أو شهور للقيام به؛ وذلك إذا تم القيامُ به على الإطلاق. ومكن لمجموعة 
خدمة العملاء معرفة مدى نجاحها في ما يتعلق بمؤشرات الأداء الرئيسية من خلال بطاقة 
blä‏ والتي تنعكسٌ بدورها على أهداف المجموعة وأهداف الشركة. 

Gl la S‏ للبيانات الموجودة في النظام ميزةً إضافيةً؛ فهي لا تدعم فقط مجموعة 
رضا العملاء؛ بل إنها أيضًا تدعمٌ وحدات الأعمال الأخرى في الشركة. فعلى سبيل المثال: 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري "n‏ 


الفصل الثالث 


هكن مدير الخط الأمامي تحليلٌ نفقات شركات الطيران على أساس كلّ سوق على Bio‏ 
لتقييم أداء العقد المتفاوض عليه أو تحديد إمكانات التوفير لتوحيد الإنفاق مع شركة 
نقل واحدة. كما يكن طمدير السفر الاستفادة من ذكاء الأعمال لاكتشاف المناطق التي 
بها كميات كبيرة من التذاكر غير امُستَخدَّمة أو الحجوزات غير المتصلة بالإنترنت ووضع 
إستراتيجيات لضبط NA‏ وزيادة التوفير العام. 

أسئلة للمناقشة: 

oa lág ga Io SL all La; ds) وماذا‎ SExpedia.com eX as ea 54 -Y 
نشاطهم التجاري؟‎ 

۲- كيف ساهم نظام البيع بالتجزئة في تحسين رضا العملاء باستخدام بطاقات الأداء؟ 

L -Y‏ هي fobisi‏ وما هو de)‏ المقترح؟ وما هي النتائج التي حصلوا عليها؟ 
Sources: Based on Microsoft. (2005). Expedia: Scorecard solution helps online travel‏ 
company measure the road to greatness. download.microsoft.com/documents/‏ 
customerevidence/22483 Expedia Case Study.doc (accessed June 2016) Editor's‏ 
note.(2004). Expedia incorporates customer satisfaction feedback and employee‏ 


input to enhance service and support. Quirks Marketing Research Media. http:// 
www.quirks.com/articles/3200420041001/.aspx (accessed July 2016). 


أسئلة مراجعة على القسم Y-Y‏ 

-١‏ ما هي ستة سيجما؟ وكيف يتم استخدامُها كنظام لقياس الأداء؟ 
3DMAIC 52 ls -Y‏ اذكر وَضْفاً بإيجاز لخطوات ©21/141. 

*- قارن بين SC‏ وستة سيجما كنظامين متنافسين لقياس الأداء. 
ع- ما هي اللكوّنات اللازمة لنظام فغّال لإدارة الأداء؟ 


تلخيصٌ لأهمٌ نقاط الفصل: 


- يعرف مستودع البيانات بأنه عبارة عن مستودع بيانات تمّ إنشاؤه بشكلٍ خاص؛ إذ يتم تنظيم 
البيانات بحيث يمكن للمستخدمين النهائيين الوصولٌ إليها بسهولة لعدَّة تطبيقات. 
- تحتوي 1315 على بيانات حول موضوع واحد (كالتسويق مثلا). يمكن أن يكون Ís DM‏ 


n‏ ذكاء الأعمال والتحليلات وعلم البيانات. منظور إداري 


التحليلات الوصفية :)١(‏ ذكاء الآعمال ومستودعات البيانات 


من مجموعة فرعية من البيانات في مستودع البيانات. وَتُعَدُ 2345 ح لا أقل تكلفةٌ يمكن 
استبداله أو يمكن أن يكمل مستودع البيانات. كما يمكن أن تكون 21/45 مستقلةً عن أو تعتمد 
على مستودع البيانات. 

ig-‏ نظام 5 نوعًا من قاعدة بيانات ملفات معلومات العملاء التي يتم استخدامها غالبًا 
كمنطقة تقسيم لمستودع البيانات. 

- يشملٌ تكاملٌ البيانات ثلاث عمليات رئيسيةء هى: الوصول إلى البيانات: واتحاد البيانات» 
والتقاط التغيير. فعندما يتم تنفيذ هذه العمليات الثلاث بشكل صحيح؛ هكن الوصول إلى 
البيانات وإتاحتها بمجموعة من 511 وأدوات التحليل وبيئات مستودعات البيانات. 

- تقوم تقنیات ۴۲1 بسحب البيانات من مصادر عديدةء وتطهیرهاء وتنزیلها فی مستودع بيانات. 
وعد ۴۲1 عمليةٌ متكاملة $ de SA g grio Gl‏ البيانات بشكل فوري أو مستودعات البيانات 
النشطة التكميلية وتوسيع التخزين التقليدية للبيانات» والانتقال إلى مجال صُنْع القرارات 
التش غيلية والتكتيكية عن طريق تنزيل البيانات بشكلٍ فوري وتوفير البيانات للمستخدمين 
لاتخاذ القرارات الفعّالة. 

- يَُدُ أمان البيانات وا معلومات وخصوصيتها من الأمور المهمة بالنسبة للمتخصص في مستودع البيانات. 





مصطلحات أساسية: 
بطاقة النتائج المتوازنة | نمذجة الأبعاد الاستخراج والتحويل |الخطة التشغيلية 
(ETL) Jyala (BSC)‏ 


d 7 FI PERI d 
(BPM) 


بيانات المكعب | الانتقال لأمفل مؤشر الأداء الرئيسي | مستودعات البيا 
(KPI)‏ الفورية (82117) 


سوق البيانات (10384) |أتكامل تطبيقات 
(EAI) oS på!‏ 


مستودع البيانات | مستودع بيانات|01:12© مخطط مجموعة 
(EDW) åuwghl (DW)‏ 
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مدير مستودع البيانات | تكامل معلومات | سوق أوبر ا لمخطط النجمي 
(DWA)‏ الشركات (1:11) 





التشغيلية (0725) 








مخزن الب E‏ 





سوق البيانات التابع ii‏ الأبعاد 





أستلة للمناقشة: 

-١‏ قارن بين تكامل البيانات و.811. وكيف يرتبطان بعضهما ببعض؟ 

lo -Y‏ هو مستودع البيانات؟ وما هي فوائده؟ ولماذا تُعَدُ إمكانية الوصول إلى الويب مهمةٌ في 

مستودع البيانات؟ 
- هل يكن ل 22/1 استبدالٌ مستودع البيانات أو استكماله؟ قارن وناقش هذه الخيارات. 
-٤‏ ناقش العوامل واب مزايا الرئيسة مستودعات البيانات للمستخدمين النهائيين. 
-٥‏ اذكر أوجه الاختلافات و/ أو الشبه بين أدوار مسؤول قاعدة البيانات ومسؤول مستودع البيانات. 
t‏ اشرح كيف هكن أن يؤدي تكامل البيانات إلى مستويات أعلى من جودة البيانات. 
۷- قارن Kimball GR o ag‏ و0nص!‏ نحو تطویر مستودع البيانات. وحدّد متی یکون کل 
منها أكثر فعالية. 

8- ناقش المخاوف الأمنية المتعلقة ببناء مستودع البيانات. 

؟- قم بالتحقيق في تنفيذ تطوير مستودع البيانات الحالي من خلال النقل إلى الخارج. واكتب 
تقريرًا حول هذا الموضوع. ثم ناقش مع زملائك هذه القضية من حيث الفوائد والتكاليف» 
وكذلك العوامل الاجتماعية. 

-٠‏ يستخدم 542 مصطلح إدارة المؤسسة الإستراتيجية Cognos pascuusg (SEM)‏ مصطلح 
إدارة أداء (CPM) o6 iI‏ ويستخدم Hyperion‏ مصطلح إدارة أداء الأعمال .)8۲M(‏ 
هل يشيرون إلى نفس الأفكار الأساسية؟ Dol p5‏ لدعم إجابتك. 

-١‏ يشمل 8811 خمس عمليات أساسية: وَضْع الإستراتيجية, التخطيط ال مراقبةء الفعلء والضبط. 
اختر إحدى هذه العمليات» وناقش أنواع أدوات البرامج والتطبيقات المتوفرة لدعمها. pii‏ 
الشكل ٠١-١‏ بعض التلميحات. ويمكنك أيضًا الاستعانة بقائمة الأدوات المساعدة الخاصة 
(Bain & Company (bain.com /management tools /home.asp á$ 5‏ 
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SÀ gat -AY‏ عامة تهمك. باستخدام التقرير السنوي للشركة لعام ١٠١۲م‏ قم بإنشاء ثلاثة 
أهداف مالية إستراتيجية لعام ۲۰۱۷م. لكل هدفه حَدَّد هدقًا أو هدفًا إستراتيجيًا. يجب 
أن تكون الأهداف متسقة مع الأداء مالي للشركة pY AT ple‏ 

-١‏ قارن بين إدارة الأداء وقياس الأداء. 

.850 قم بإنشاء إستراتيجية لشركة افتراضية؛ وذلك باستخدام وجهات النظر الأربع من‎ -١ 
مع التعبير عن الإستراتيجية كسلسلة من الأهداف الإستراتيجية. ثم قم بِوَضْع خريطة‎ 
إستراتيجية تصؤر الروابط بين الأهداف.‎ 

5- قارن نموذج 214410 مع عمليات الحلقة المغلقة ل 8534 

-١‏ اختر شركتين تعرفهما جيدًا. ما هي المصطلحات التي يستخدمونها لوَصْف مبادراتهم الخاصة 
ب 8214 وتركيبات البرامج؟ ثم قارن وميّز بين عروضهم من حيث تطبيقات ووظائف BPM‏ 


تمارين: جامعة تيراداتاء والتدريبات العملية الأخرى: 


1055 وامتاح على موقع‎ 0062-0012 Japan بالنظر في حالة تطوير مستودع بيانات لشركة‎ -١ 
1,3 .http;//dssresources.com/cases/coca-colajapan «,..55Jl Js Resources 
الحالةجيدًا وأجب عن الأسئلة التسعة بمزيد من التحليل والمناقشة.‎ 

؟- اقرأ مقال الكرة ))7٠١0(‏ وقم بترتيب المعايير (وفقًا لمنظمة حقيقية). في تقريرء اشرح مدى 


أهمية JS‏ معيار وماذا؟ 
“- اشرح متى يجب أن تقوم بتطبيق بنية ثنائية أو ثلاثية الطبقات عند التفكير في تطوير 
مستودع بيانات. 


-٤‏ اقرا حالة ontinenta1 Airlines‏ الكاملة (قصة نجاح تخزين بيانات شائعة للغاية) على 
شبكة -Teradata university.com‏ وأجب عن الأسئلة. 

مني Harrah gb jl" Alios ailes] Au ge orig Í$) teradatauniversitynetwork.com‏ 
العالية من معلومات العميل“. ثم قم بربط Harrah glo‏ بما ستستخدمه شركات الطيران 
والكازينوهات الأخرى في بيانات العملاء. 

teradatauniversitynetwork.com à‏ إقرأ الإجابة عن أسئلة المهمة ”فشل مستودعات 
البيانات“. ونظرًا لأن نماني حالات موصوفة في هذه المهمة؛ فيمكن تقسيم الفصل إلى تماني 
مجموعات» مع تعيين حالة واحدة ds‏ مجموعة. lal‏ إلى ذلك؛ اقرأ لصة دعلصقاعة رهم 
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Watson (20062)‏ وحَدَّد لكلّ حالة كيف حدث الفضْلٌ على أنه لا يرتبط بالتركيز على واحد 
أو أكثر من عوامل نجاح المرجع. 

۷- ق teradatauniversitynetwork.com‏ اقرا وأجب عن الأسئثلة الخاصة ههمة «تقنية -۸۵ 
.«MicroStrategy cL siib (ecl lol eS plas Lu] :Vent‏ يمكن الوصول إلى 
MicroStrategy eb,‏ من موقع Ll Ce, as TUN‏ في استخدام العرض التقديمي 
Barbara Wixom _‏ حول برنامج رع٤†aا†o5اMic‏ «العروض التقدهية للبرنامج gl‏ 
««MicroStrategy Tutorial‏ والذي يتوفر أيضًا على TUN ass‏ 

teradatauniversitynetwork.com (à -A‏ شاهد ندوات الويب التي تحمل عنوان: «مستودعات 
البيانات الفورية: الجيل التالي من إدارة بيانات دعم القرار» و«بناء المؤسسة بشكل فوري». 
ثم اقرأ المقالة التي بعنوان: «البنية المرجعية للمؤسسات بشكل فوري في تيراداتا: مخطط 
لمستقبل تقنية المعلومات»» والتي تتوفر في هذا الموقع. وقم بوصف كيفية عمل المفاهيم 
والتقنيات الفوريةء وكيف يمكن استخدامها لتوسيع نطاق مستودعات البيانات الحالي وأبنية 
ذكاء الأعمال لدعم القرارات اليومية. واكتب تقريرًا يوضّح كيف أن RDW‏ تقدّم مَيْرْةٌ 
تنافسيةٌ للمؤسسات على وجه التحديد. ثم قم بوصف الصعوبات في مثل هذه التطبيقات 
والعمليات بالتفصيلء ثم وصف كيفية معالجتها Éles‏ 

teradatauniversitynetwork.com ($ -‏ شاهد ندوات الويب بعنوان: «النهوض بتكامل البيانات: 
برامج التشغيل الجديدة والمقاربة الناشئة» و«البحث عن نسخة واحدة للحقيقة: إستراتيجيات 
لتدعيم الصوامع التحليلية» و«دّمْج البيانات: استخدام .1811 و۴۸1 و۴11 أدوات لإنشاء مؤسسة 
متكاملة». واقرأ أيضًا التقرير البحثي «دَمْج البيانات». قارن بين العروض التقديمية. ما هي 
القضية الأكثر أهميةً التي تمّ وصفها في هذه الحلقات الدراسية؟ وما هي أفضل طريقة للتعامل 
مع الإستراتيجيات والتحَدَّيات الخاصة بتوحيد إدارة البيانات وجداول البيانات في بنية مُوخّدة 
لمستودعات البيانات؟ قم بإجراء بحث على الويب؛ للتعرّف على آخر التطؤرات في هذا ا مجال. 
ثم قارن العرض التقدهي بالمادة في النص والمادة الجديدة التي عثرت عليها. 

-٠١‏ بالنظر في مستقبل مستودعات البيانات. قم بإجراء بحث على الويب حول هذا الموضوع. أي اقرا 
هاتين المادتين: (31 L. (2006, March‏ ,4805]8. مستودعات البيانات في عالم مسطح: اتجاهات 
لعام :DM Direct Newsletter; and Geiger, J. G. (2005, November). CIFe —..Y**3‏ 
تتطور مع العصر. مراجعة .٤١-۳۸ DM‏ قارن وقارن نتائجك. 
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۹- بالوصول إل .teradatauniversitynetwork.com‏ حَدَّد أحدث المقالات والتقارير البحثية 
وحالات مستودعات البيانات. مع وَصْف التطورات الأخيرة في هذا المجال. اذكر في تقريرك؛ 
كيف يتم استخدامٌ مستودعات البيانات في ذكاء الأعمال و255. 

؟١-‏ انتقل إلى موقع <زمء.ء6نا1 نامآ وابحث عن «حالات 16720268 851»؛ إذ تشير 851 إلى 
Business Solutions Inc"‏ ". 47» ثلاث حالات تخزين بيانات مثيرة للاهتمام» وشاهدها 
بعناية» واكتب تقريرًا لمناقشة النتائج التي توصّلت إليها حول مشكلات العمل واقتراحها 
الحلول الاستقصائية. 

às .teradatauniversitynetwork.com |J] Jàzl -W‏ نوع المحتوى «المقالات». تصفح قائمة 
«SNL ALI‏ وحَدَّد موقعًا بعنوان: «إدارة أداء الأعمال/ الشركات: تغيير منظر البائع وأهداف 
السوق الجديدة». flo‏ على المقالةء أجب عن الأسئلة التالية: 

-١‏ ما هو التركيز الأساسي للمادة؟ 

'- ما هي «الوجبات السريعة» الرئيسة من المادة؟ 

*- في المقالة, ما هي الوظيفة أو الدور التنظيمي الأكثر مشاركة بشكلٍ وثيق $CPM d‏ 

-٤‏ ما التطبيقات التي تغطيها 01/1؟ 

0- كيف تشبه هذه التطبيقات أو تختلف عن التطبيقات التي تغطيها 051/1 لشركة SGartner‏ 

1- ما هي 810؟ وما هي صلتها بأداء الشركة؟ 

la -V‏ هي بعض عمليات الاستحواذ الرئيسة التي حدثت في سوق الاجتماع التحضيري للمؤتمر 
خلال العامين الماضيين؟ 

ode -A‏ اثنتين من الشركات التي منت مناقشتها في المقالة (وليس 585 أو عاع02 أو 183/1). ما هي 
إستراتيجيات 0721 لكل من الشركات؟ كيف يفكر المؤلفون فيما يتعلق بهذه الإستراتيجيات؟ 

-١5‏ انتقل إلى (XE -teradatauniversitynetwork.com‏ نوع المحتوى «دراسات الحالة». 
تصفح قائمة الحالات. وحَدد موقع «لوحات ole îlog «Western Digital $ ijg Oblo‏ 
هذه المقالة. أجب عن الأسئلة التالية: 

SVIS ما هو‎ -١ 

58214 عن بنية‎ ١/15 تختلف بنية‎ gf alès AS -Y 

۴- ما هي أوجه التشابه والاختلاف بين عمليات الحلقة المغلقة من 8524 والعمليات في دورة 
قرار 00104 (رَصْدء توجيه: اتخاذ قرارء الفعل)؟ 
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-٤‏ ما هي أنواع لوحات المعلومات الموجودة في النظام؟ هل هي تشغيلية أم تكتيكية؟ أم 
هي في الواقع بطاقات أداء؟ اشرح إجابتك. 

La -0‏ هي المزايا الأساسية التي يوفرها نظام VIS‏ ولوحات ال معلومات ۉ Digital‏ Western؟‏ 

1- ما أنواع الاستشارات التي يمكنك تقدهها إلى شركة تستعدٌ لإنشاء لوحات 7715 الخاصة بها؟ 


مهام الفريقء ومشروعات لعب الأدوار: 

-١‏ كانت Kathryn Avery DBA‏ مع سلسلة متاجر التجزئة على مستوى البلاد (سلسلة كبيرة) 
على مدى السنوات الست الماضية. وقد طُلب منها في الآونة الأخيرة قيادة تطوير أول 
Chain à LL, à GU g»sz ua‏ 818. كان المشروع برعاية الإدارة العليا ورئيس قسم 
المعلومات. يتمثل الأساس المنطقي لتطوير مستودع البيانات في النهوض بأنظمة التقارير - لا 
سيما في المبيعات والتسويق وعلى المدى الطويل - لتحسين إدارة علاقات العملاء في السلسلة 
الكبيرة. وقد ذهبت ٣رإطاةK‏ إلى مؤتمر معهد مستودعات البيانات وكانت تقوم ببعض 
القراءة؛ لكنها لا تزال مغمورة بشأن منهجيات التطوير. إنها تعلم أن هناك مجموعتين - 
EDW (Inmon)‏ و)Kimba11)‏ 12315 الهيكلي - واللتان تمتلكان مَيْزات قوية بنفس القدر. 
في البداية؛ كانت تعتقد أن المنهجيتين مختلفتان «SUE‏ 553 نظرًا لأنها درستهما بعناية أكثر 
فلم تكن على يقين من ذلك. لدى «تإعطاه؟1 عددٌ من الأسئلة التي ترغب في الإجابة عنها: 
-١‏ ما هي الفروق الحقيقية بين المنهجيات؟ 
'- ما هي العوامل اللهمة في اختيار منهجية معينة؟ 
ha -Y‏ ينبغي أن تكون خطوتها التالية في التفكير في المنهجية؟ 
Kathryn as La‏ الإجابة عن هذه الأسئلة. (تمّ تعديل هذا التمرين من 
.(Duncan, K., Reeves, L., & Griffin, J. 2003, Fall‏ منظور ذكاء الأعمال الخبراء. 
-Business Intelligence Journal, 8(4), 14-19‏ 

-Y‏ يعد Kumar‏ ]66[ مدير مستودعات البيانات في بنك إقليمي كبير. تم تعيينه قبل 
٥‏ سنوات لتنفيذ مستودع بيانات لدعم إستراتيجية عمل 0۸M‏ الخاصة بالبنك. باستخدام 
مستودع البيانات؛ نجح البنك في دمج معلومات العملاء وفهم ربحية العملاء وجذب العملاء 
وتعزيز علاقات العملاءء والاحتفاظ بالعملاء. على مَرّ السنينء اقترب مستودع بيانات البنك من 
الفورية من خلال الانتقال إلى عمليات التحديث المتكررة لمخزن البيانات. والآن؛ يريد البنك 
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تنفيذ تطبيقات الخدمة الذاتية للعملاء ومراكز الاتصال التى تتطلب بيانات أكثر عذوبةٌ مما هو 
متوفر حاليًا في المستودع. يريد 006[ بعض الدعم في النظر في إمكانيات تقديم بيانات أعذب. 
asi‏ أحد البدائل لذلك هو الالتزام الكامل بتنفيذ RDW‏ لدى مورد .111 استعدادٌ لمساعدته 
على إجراء هذا التغيير. ومع ذلك؛ فقد تمّ إبلاغ )166 عن تقنيات 841 و1811 ويتساءل كيف 
هكن أن تتناسب مع خططه. وعلى وجه الخصوص يتساءل 264[ الأسئلة التالية: 

SEII5 EAI ما هي بالضبط تقنيات‎ -١ 

SETL.., يرتبط 841 و5811‎ àS -Y 

SRDW ., 8119 841 يرتبط‎ AS -Y 

€- هل 455 كلّ من Elg EAI‏ ضروريتين d laSa f RDW J‏ أم بديلتين عنها؟ 

ساعد 266[ في الإجابة عن هذه الأسئلة. (تم تعديل هذا التمرين من 
.Brobst, S., Levy, E., & Muzilla, C. 2005, Spring‏ تكامل تطبيقات المؤسسات 
وتكامل معلومات الشركات. )27-33 ,)2( 10 „Journal Intelligence Journal,‏ 

۴- قم مقابلة امسؤولين في كليتك أو ado aud‏ التنفيذيين في منظمتك؛ لتحديد كيف يمكن أن 
يساعدهم مستودعات البيانات في عملهم. اكتب اقتراحًا يَصف نتائجك. مع تضمين تقديرات 
التكلفة والفوائد في تقريرك. 

ع- راجع قائمة مخاطر مستودعات البيانات اللموضّحة في هذا الفصل» وابحث عن مثالين لكل منها 
في الواقع العملي. 

ه- يمكنك الوصول إلى 3دم».6780868] وقراءة الأوراق البيضاء «قياس عائد استثمار مستودع 
البيانات» و«تحقيق عائد الاستثمار: إسقاط وحصاد قيمة الأعمال مستودع بيانات اممؤسسة». 
أيضًاء شاهد الدورة المستندة إلى الويب «عامل عائد الاستثمار: كيف يتعامل الممارسون 
الرائدون مع المسائل المعقدة لقياس عائد الاستثمار cios ».0W‏ أهمّ القضايا الموضّحة 
فيها. قارن هذه القضايا بعوامل النجاح الموصوفة في (2006a)‏ WatsonوAriyachandra.‏ 

ll A‏ المقال بقلم Liddell Avery, K., & Watson, H. J. (2004), Fall‏ تدريب المستخدمين 
النهائيين لمستودعات البيانات. Journal Intelligence Journal, 9 (4), 40-51 (which‏ 
„available at teradatauniversitynetwork.com)‏ 5 في الفئات المختلفة للمستخدمين 
النهائيين» قم بوَضْف الصعوبات التي تواجههم» ومناقشة فوائد التدريب المناسب لكل 
مجموعة. اجعل كل عضو من أعضاء المجموعة يتولى أحد الأدوارء وقم بإجراء مناقشة حول 
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كيفية أن يكون نوعًا مناسبًا من التدريب على مستودعات البيانات مفيدًا لكل منكما. 

JS päi -V‏ مورد من موردي /882/1/053 تقريبًا دراسات حالة على مواقع الويب الخاصة به. باعتبارك 
فريق عمل» حَدّد اثنين من هؤلاء المورّدين (يمكنك الحصول على أسمائهم من قوائم gf Gartner‏ 
(AMR‏ ثم قم باختيار حالتين من كلّ موقع من هذه المواقع. ولكلّ حالة قم بإجراء ما يلي: 

-١‏ تلخيص المشكلة التي كان العميل يحاول معالجتها. 
۲- التطبيقات أو الحلول التي تم تنفيذها. 
*- الفوائد التي يتلقاها العميلٌ من النظام. 

تمارين الإنترنت: 

-١‏ ابحث في الإنترنت للعثور على معلومات حول مستودعات البيانات. حَدَّد بعض مجموعات الأخبار التي 
لها اهتمامٌ بهذا المفهوم. استكشف 481/1318010/1 في مكتبتك ومكتبتك الإلكترونية وعاع00© 
technologyevaluation.com tdwi.org .» lul .£ ssl Jg» 42d] cll ue eX‏ 
واموردين الرئيسيين: تزمء.720248ع] وتدمء.5ة5 وoracle.com‏ وncr.com.‏ تحقق أيضًا من 
-db2mag.com dssresources.com s dmreview.coms cio.com‏ 

-egain.com fairisaac.com gs lot وبعض الموردین.‎ ETL استطلع رأي بعض أدوات‎ -۲ 
informationbuilders.com QS „Aus q"Ul5) dmreview.com أيضًا استشر‎ 

*- اتصل ببعض مورّدي مستودع البيانات. واحصل على معلومات حول منتجاتهم. أعط اهتمامًا 
خاضًا للمورّدين الذين يقدَّمون أدوات لأغراض مُتعدَّدة, مثل: 209ع0©). و& Software A‏ 
yaw òg -Oracles SAS Institutes .G‏ هؤلاء المورّدين عروضًَا تجريبيةٌ مجانيةٌ عبر 
الإنترنت. قم بتنزيل عرض أو اثنين منها وقم بتجربتهما. اكتب تقريرًا عن تجربتك. 

teradata.com guai -€‏ للتطورات وقصص النجاح حول مستودعات البيانات. اكتب تقريرًا عمًا اكتشفته. 

los oe LÍou tteradata.com gas -0‏ البيضاء والدورات المستندة إلى الويب حول 
مستودعات البيانات. قراءة السابق ومشاهدة هذا الأخير. (قسّم الصف حتى يتم تغطية 
جميع المصادر) اكتب تقريرًا عمًا اكتشفته. 

1- قم بإيجاد حالات حديثة من تطبيقات مستودعات البيانات الناجحة. انتقل إلى مواقع مورّدي 
مستودع البيانات وابحث عن الحالات أو قصص النجاح. اختر واحدة منهاء واكتب ملخصضًا 
مختصرًا لتقدهه إلى زملائك. 
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الفصل الرابع 
التحليلات التنبؤية (V)‏ 
عملية» وطرقء وخوارزميات التنقيب في البيانات 


أهداف التعلم: 
- تعريف التنقيب في البيانات كتقنية تمكينية لتحليلات الأعمال. 
- فهم أهداف وفوائد التنقيب في البيانات. 
- الدراية الكاملة بمجموعة واسعة من تطبيقات التنقيب في البيانات. 
- تعلّم عمليات التنقيب في البيانات القياسية. 
- تعلّم أساليب وخوارزميات مختلفة من التنقيب في البيانات. 
- بناء الوعي بأدوات البرامج الحالية للتنقيب في البيانات. 
- فهم قضايا الخصوصية ومشكلات وخرافات التنقيب في البيانات. 

بصفة عامة؛ يعد التنقيب في البيانات Ais Jb‏ لتطوير المعلومات الاستخبارية (أيْ: المعلومات 
أو المعرفة القابلة للتطبيق) من البيانات التي تُعنى المنظمة بجمعها وتنظيمها وتخزينها. 
وتستخدمٌ المنظمات مجموعةً واسعة من تقنيات التنقيب في البيانات للحصول على فهم أفضل 
لعملائها ولعملياتها ولحل المشكلات التنظيمية المعقدة. وندرس في هذا الفصل عملية التنقيب في 
البيانات كتقنية تمكينية لتحليلات الأعمال والتحليلات التنبؤية» والتعرّف على العمليات القياسية 
لإجراء مشار يع التنقيب في البيانات» وفهم وبناء الخبرات في استخدام تقنيات التنقيب في البيانات 
الرئيسة» وتطوير الوعي بأدوات البرامج الموجودة. واستكش اف قضايا الخصوصية والخرافات 
الشائعة والمشكلات التي ترتبط غالبًا بالتنقيب في البيانات. 


١-4‏ مقال افتتاحي: قسم شرطة ميامي ديد يستخدم التحليلات التنبؤية؛ 
للتنبؤ بالجريمة ومكافحتها: 

أصبحت التحليلات التنبؤية والتنقيب في البيانات ii‏ لا يتجزأ من العديد من وكالات إنفاذ 
القانون» ا في ذلك إدارة شرطة ميامي ديد والتي لا تقتصر مهمتها على حماية أمن أكبر مقاطعة 
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في فلوري دا التي تضم ۲,١‏ مليون مواطن (مما يجعلها سابع أكبر ولاية في الولايات اممتحدة)» 
ولكن أيضًا لتوفير مناخ آمنٍ وجذاب طلايين السياح الذين يأتون من جميع أنحاء العام للاستمتاع 
بالجمال الطبيعي للمقاطعةء وكذلك المناخ الدافئ» والشواطن الخلابة. ومع إنفاق السياح ما 
يقرب من ٠١‏ مليار دولار أمريي كلّ عام وضعٌ ما يقرب من ثلث ضرائب المبيعات في فلوريدا؛ 
فمن الصعب المبالغة في أهمية السياحة في اقتصاد المنطقة. وعلى الرغم من أن قلةً من ضباط 
الشرطة في المقاطعة من المرجّح أن يدرجوا التنمية الاقتصادية في وَضْف وظائفهم؛ فإن كلهم 
تقريبًا يدركون العلاقة الوثيقة بين الشوارع الآمنة والازدهار الذي تحرّكه السياحة في المنطقة. 

وعد هذه القضية ذات أهمية قصوى بالنسبة للملازم أرنولد بالمرء الذي يشرف حاليًا على 
قسم التحقيقات في السرقة» والمشرف السابق على تفاصيل التدخل في قضايا السرقة في الإدارة. 
إذ يركز هذا الفريق المتخصّص من المحققين بشكلٍ مُكنَّف على مراقبة النقاط الساخنة للسرقة 
بالمقاطعة وأسوأ المخالفين. ويحتل هو وفريقه مكاتب متواضعة في الطابق الثاني من مبنى 
خرساني حديث المظهرء متفرّع من شارع مُحاط بالنخيل على الطرف الغربي من ميامي. وقد شهد 
بالمر الكثيرَ من التغييرات في السنوات العشر التي قضاها في الوحدةء من أصل Gle YY‏ في القوة. 
ولا يقتصر الأمرٌ على ممارسات الشرطة. مثل الطريقة التي استخدمها فريقه في تحديد المواقع 
الساخنة لجرائم الشوارع باستخدام دبابيس ملوّنة على خريطة. 


تقليص خدمات الشرطة: 

وشهد بالمر وفريقه أيضًا تأثير تزايد عدد السكان. وتحؤل التركيبات السكانية, والاقتصاد المتغير في 
الشوارع المخولون بحراستها. ومثل أيّ قوة شرطة جيدة؛ قاموا بتعديل أساليبهم وممارساتهم باستمرار؛ 
مواجهة تحَذَّي الشرطة الذي اتسع نطاقه وازداد تعقيده. ولكن على غرار جميع فروع حكومة 
المقاطعة تقريبًا؛ فإن ضغوط اللوازنة المتزايدة وضعت الإدارة في حالة ضغط بين الطلبات المتزايدة 
lig‏ ص الموارد. يقول بالمرء الذي يرى اممحققين كمقاتلين في خط المواجهة ضد موجة متصاعدة من 
جرائم الشوارع والاحتمالات المرتقبة لموارد متشددة: «كان التحَدّي الأساسي الذي واجهناه؛ هو كيفية 
is‏ من جرائم الشوارع حتى في الوقت الذي تسببت فيه الموارد المحدودة في تقليص عدد رجال 
الشرطة في الشارع». كان الفريق على مَرٌ السنين مُصِرَّحًا له بتجربة أدوات جديدة: كان أبرزها برنامجاً 
أطلق عليه «الإنفاذ القائم على التحليلات»» والذي استخدم بيانات تاريخ الجرهة كأساس لتعيين فرق 
التحقيق. ويضيف بالمر: «لقد تطوّرنا كثيرا منذ ذلك الحين في قدرتنا على التنبؤ بالمكان الذي يمكن أن 
يحدث فيه سرقة؛ وذلك من خلال كل من استخدام التحليل وتجربتنا الجماعية الخاصة». 
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التفكير الجديد في الحالات الباردة: 


يتمثل التحَدَّي الأكثر إرباكًا لبالمر وفريقه من المحققين في إغلاق الحالات الأصعبء وهو تحَدّ 
مشترك مع الشرطة في جميع المناطق الحضرية الرئيسة؛ إذ يفتقرٌ إلى الأدلة أو الشهود أو الفيديو 
(أيْ: الحقائق أو الأدلة التي يمكن أن تساعد في حَلٌ قضية ما). يقول بالمر: «الأمرٌ ليس مفاجنًا؛ 
لأن الممارسات القياسية التي استخدمناها في توليد العملاء ابمحتملين» مثل: التحدَّثْ إلى المخبرين 
أو ا مجتمع أو ضباط الدوريات؛ لم تتغيّر كثيرا. على dio JS‏ يعمل هذا النهج بشكلٍ جيد؛ لكن 
أحد عيوبه أنه يعتمد كثيرًا على خبرات محققينا. فإذا تقاعد هؤلاء المحققون أو انتقلوا إلى أعمالٍ 
أخرى؛ فإن هذه الخبرات تذهب معهم». 

كان لغرٌ بالمر هو أن معدل الدوران - بسبب تقاعد العديد من المحققين الأكثر خبرةً لديه - 
كان في اتجاه do ói Jl doss giela‏ هذا اللغز يكمُّنُ في ضَخّ دماء جديدة من محققين 
أصغر سند فهم أيضًا يجيدون التعامل مع أنواع المعلومات الجديدة - كرسائل البريد الإلكتروني» 
ووسائل الإعلام الاجتماعية» وكاميرات المرور. على سبيل المثال لا الحصر - وذلك مِكُنه أيضًا من 
الوصول السريع إليها. ولكن كما يقول با مر: «جاءت المشكلة عندما تحؤّلت مجموعةٌ من 
المحققين الجُدُد الذين جاءوا إلى الوحدة للبحث عن توجيهات من كبار الضباط. في هذه المرحلة 
فقط تأكدنا أننا بحاجة إلى طريقة مختلفة لملء فجوة الخبرة في المستقبل». 

وقد أذّتَ جه ودُ بالمر المنصبّة على التفكير في حَل لهذا اللغز؛ إلى التوصّل إلى ما يُسمّى تكهُنات 
السماء الزرقاء. فماذا لو أن المحققين الجدد في الفرقة يمكن أن يطرحوا نفس الأسئلة على قاعدة بيانات 
الحاسبء كما لو كانوا مخبرًا مخضرمًا؟ زرعت هذه المضاربة في عقل بال مر عددًا لا نهائيًا من الأفكار. 


الصورة الكبيرة تبدأ صغيرة: 

أظهر ما كان يتبلور داخل وحدة كشف جرائم السرقة, كيف يمكن للأفكار الكبيرة أن تأتي من 
أماكن صغيرة. ولكن الأهم من ذلك؛ هو أنه تبَيّن أنه لكي تصل هذه الأفكار إلى مرحلة الثبات؛ 
يجب أن تكون الشروط «الصحيحة» متوافقة في الوقت المناسب. فعلى مستوى القيادة؛ فإن 
ذلك يعني أن الشخصية القيادية في المنظمة هي التي تعرف ما يتطلبه الأمر من أجل تغذية 
الدعم من أعلى إلى أسفل؛ فضلًا عن استقاء المعلومات الذكائية كذلك من أسفل إلى أعلى داخل 
الهيكل التنظيمي. كان هذا الشخص هو بالمر نفسه. على المستوى التنظيمي؛ شكُّلت وحدة 
جرائم السرقة نقطة انطلاق جيدة بشكلٍ خاص لنمذجة المبادرة؛ بسبب قيام بعض الجُناة بتكرار 
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جرائمهم. وفي النهاية؛ فإن قدرة الإدارة على إطلاق العنان للقدرة التحويلية الأوسع نطاقًا لنمذجة 
اطبادرة ستعتمدٌ إلى حَدٌ كبير على قدرة الفريق على تحقيق قيق النتائج على نطاق أصغر. 

عندما أثبتت الاختباراتٌ المبكرة والعروض التوضيحية أنها مشجعةً - رغم hæ è gògail of‏ 
نتائج ái.‏ إلا عندما تم تغذيته بتفاصيل الحالات التي تم Vlr‏ - بد أ الفريق في جذب الانتباه. 
وقد تلفت أطبادرة دفعة E‏ عندما عبر مسؤولو وحدة شرطة السرقة عن دعمهم لاتجاه 
المشروع» وقالوا لبا مر: «إذا استطعت القيام بهذا العمل فافعل». ولكن الأهم من التشجيع - 
كما يُوضح بام مر - هو استعدادهم للدفاع عن المشروع بين الأقسام الأعلى ثي الإدارة. يقول با مر: 
o asl b»‏ المشروع على الأرض إذا مم يباركه كبار الضباط؛ لذلك كان دعمهم حاسمًا». 


النجاحٌ يجلبٌ المصداقية: 


بعد تعيين المسؤول الرُسمي للاتصال بين تقنية المعلومات ووحدة مكافحة السرقة؛ شرّع بالمر 
في تعزيز أداة نمذجة المبادرة - والتي يُطلّق ga Blue PALMS Gou) GYI lese‏ أجل برامج 
النمذجة الرائدة في التحليلات التنبؤية - من خلال تحقيق العديد من النجاحات المتوالية. م 
يكن أنصاره من كبار الضباط فحسب؛ بل أيضًّا هؤلاء المحققون الذين سيكون دعمهم حاسمًا في 
تبنّيه بنجاح كأداة لمكافحة السرقة. وقد قُويل باممر عند محاولته تقديم 241.815 علا بمقاومة 
عنيفة من قبل المحققين القدامى, الذين لم يكن لديهم أي مبرر للتَخَلي عن ممارساتهم القدهة. 
وهنا أدرك بالمر أنَّ الإملاء أو الإكراه لن يجعله ينال وُدّهم وبالتالي ولا دعمهم. ولذا سيحتاج إلى 
بناء جسر من المصداقية. 

وجد با مر تلك الفرصة في واحدٍ من أفضل المحققين لديه وأكثرهم خبرةً. في وقثِ مبكرٍ من 
التحقيق في السرقة؛ أشار المحقق إلى باللر أنه كان لديه حدسٌ قوي بمرتكب الجرهة المطلوب 
ضبطه بالأساس, لاختبار نظام 241.15 8106. وبناءً على طلب المحقق؛ قام محلل القسم بتغذية 
النظام بالتفاصيل الرئيسة للجرهةء ا في ذلك طريقة التشغيل. وقامت النماذجٌ الإحصائية 
للنظام بامقارنة بين هذه التفاصيل وقاعدة البيانات التاريخية للبيانات؛ وذلك بحنًا عن ارتباطات 
وأوجه تشابه مهمة في تحديد هوية ا مجرم. وقد تضمُن التقرير الذي صدر عن العملية قانمة 
تضم ۲۰ مشتبهًا تم ترتيبهم حسب ترتيب قوة الجرهة أو احتمال حدوثها. وعندما قام ا محلل 
بتسليم التقرير للمحقق؛ كان المشتبه فيه ضمن المراكز الخمسة الأولى. وبعد فترة وجيزة من 
اعتقاله؛ اعترف» واكتسب بل مر أرضًا صلبةٌ لمشروعه. 
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على الرغم من أنه كان تمريئًا مفيدًا؛ فقد أدرك بالمر أن الاختبار الحقيقي لم يكن في تأكيد الحدس؛ 
ولكن في كسر الحالات التي وصلت إلى طريق مسدود. وعلى pa iA‏ بالمر: «كان هذا هو الوضع 
في سرقة السيارات؛ إذ لا شهود ولا فيديو ولا مسرح جرهة». عندما قام المخبرٌ الأقدم في القضية 
المتوقفة بإجازة بعد ثلاثة أشهر؛ طلب المخبرٌ الصغير الذي 3& تعيينه له تقرير 281/5 علناظ8. وتم 
عرض صورٍ لأشخاص ذوي حيثية في قائمة المشتبه فيهم, وقام الضحايا بتحديد هوية المشتبه فيه 
بشكل دقيق؛ مما أدى إلى ختام ناجح للقضية. وكان هذا المشتبه فيه رقم واحد في القائمة. 


الحقائق فقط: 

لقد تمخّض النجاحٌ js Blue PALMS J Jolai‏ نجاح با مر في استقطاب المحققين إلى alo‏ 
ولكن إذا كان هناك جزءٌ من رسالته يَلقى مزيدًا من الصدى لدى المحققين التابعين له؛ فإن الحقيقة 
هي أنه قد تمّ مراعاة عدم تغيير أساسيات ممارسات الشرطة عند تصميم 2813/15 Sİ L Blue‏ 
من ذلك فقد تمّ تحسينها من خلال مَنْحهم فرصةً ثانيةً لتفنيد مزاعمهم تلك بعدم قدرتهم على 
مجابهة التطورات الحديثة. يقول بالمر: «إنَّ عمل الشرطة هو جوهرٌ العلاقات الإنسانية - من 
حيث التحدّث مع الشهود. مع الضحاياء مع المجتمع - ونحن لسنا على استعداد لتغيير ذلك؛ بل إن 
هدفنا هو مَنْح الباحثين إحصاءات واقعية من المعلومات التي لدينا بالفعل والتي قد تُحدث فرقًا؛ 
لذا حتى لو نجحنا بنسبة 0> من الوقت؛ فسوف نأخذ الكثير من المذنبين من الشارع». 

لقد ساعدت القائمة ا متزايدة للحالات الباردة التي حلَّها بالمر في جهوده لتعزيز مزايا »81 
5 ولكن في إظهار أين يكمُّنُ ولاؤه؛ فهو يرى أن المحققين الذين أغلقوا هذه الحالات 
الباردة - وليس البرنامج - أنهم يستحقون مزيدًا من تسليط الضوء عليهم وقد أت ذلك اللَهْج 
بشماره كما خطط له با مر. los‏ على طلب رئيسه. بدأ بالمر في إجراء اتصالاته كمنصة للوصول 
إلى مناطق أخرى في إدارة شرطة ميامي ديد. 


شوارع أكثر أمانًا تعني مدينةً أكثر أناقةٌ: 

عندما يتحدث عن تأثير السياحةء وهي مؤشرٌ ترابط تد من خلال رؤية مدن ميامي ديد 
35SI‏ 55 ينظر با لمر إلى de Blue PALMS‏ أنها أداةٌ مهمة لحماية أحد أعظم أصول اللقاطعة. 
يقول با مر: «كان التهديد للسياحة بسبب تزايد الجرائم في الشوارع سببًا رئيس ا في تأسيس 
الوحدة». ويضيف: «إن حقيقة قدرتنا على استخدام التحليلات والذكاء لمساعدتنا في إغلاق 
المزيد من القضايا وإخلاء الشوارع من المجرمين» هو خبرٌ سار لمواطنينا ولصناعة السياحة لدينا». 
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ماذا يُمكننا أن نتعلّم من هذه المقالة القصيرة؟ 

تتعرّض هيئات وإدارات تطبيق القانون لضغوط هائلة لتنفيذ مهمتها المتمثلة في حماية الأشخاص 
ذوي الموارد المحدودة. إِنَّ البيئة التي يؤدون فيها واجباتهم تصبح أكثر تحديًا على نحو متزايد؛ 
بحيث يتعيّن عليهم أن يتخذوا باستمرار موقعًا في قلب الحدث ورا يبقون على بُعْد خطوات قليلة 
ع احتمال وقوع كوارث. ويمثل فهم الطبيعة المتغيرة للجريمة والمجرمين تحديًا مستمرًا. ففي 
gàs‏ هذه التحَدّيات؛ يعمل توفر البيانات وتقنيات التحليلات؛ من أجل تحليل الأحداث الماضية 
بشكل أفضل والتنبؤ بالأحداث المستقبليةء ويصبٌ ذلك كله في صالح هذه الوكالات. 

وقد أصبحت البيانات متاحةً أكثر مما كانت عليه في الماضي. وبالتالي؛ فإن تطبيق أدوات 
التحليل المتطوّرة وأدوات التنقيب في البيانات (أيْ: تقنيات اكتشاف المعرفة) على هذه المصادر 
الضخمة والغنية بالبيانات يوفر لهم الرؤية التي يحتاجون إليها لتحضير وتنفيذ واجباتهم بشكلٍ 
أفضل. وبذلك تكون وكالات تطبيق القانون من al‏ المستخدمين للوجه الجديد للتحليلات؛ 
da Mf‏ التنقيب في البيانات مرشهًا أساسيًا لفهم أفضل وإدارة أقوى للمهامٌ الحسّاسة فضلًا عن 
مستوى عالٍ من الدقة والتوقيت المناسب. وتوضّح الدراسة المعروضة في القالة القصيرة الافتتاحية 
بوضوح قوة التحليلات والتنقيب في البيانات لتوفير رؤية شاملة لعام الجرهة وا مجرمين؛ من أجل 
تفاعل وإدارة أفضل وأسرع. وسنعرض في هذا الفصل مجموعةٌ واسعةً من تطبيقات التنقيب 
في البيانات التي تقدّم حلولًا للمشكلات المعقدة في مجموعة متنوعة من الصناعات والإعدادات 
التنظيمية؛ إذ يتم استخدام البيانات للحصول على رؤية قابلة للتطبيق بغرض تحسين جاهزية 
المهمة ورفع الكفاءة التشغيلية وتحقيق الميزة التنافسية. 
أسئلة مراجعة على المقالة الافتتاحية: 
-١‏ طاذا تتبَنّى وكالات تطبيق القانون والإدارات. مثل إدارة شرطة ميامى ديد التحليلات المتقدمة 

والتنقيب في البيانات؟ f‏ 
-١‏ ما هي أهمُ التحَدّيات التي تواجه وكالات تطبيق القانون والإدارات» مثل إدارة شرطة ميامي 


ديد؟ هل يمكنك التفكير في تحَدَّيات أخرى (غير مذكورة في هذه الحالة) يمكنها الاستفادة 
من التنقيب في البيانات؟ 


*- ما هي مصادرٌ البيانات التي تس تخدمها وكالات تطبيق القانون والإدارات» مثل إدارة شرطة 
ميامي ديد لمشاريعها المتعلقة بكلّ من النمذجة التنبؤية والتنقيب في البيانات؟ 
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ع- ما نوع التحليلات التي تستخدمها وكالات تطبيق القانون والإدارات» مثل إدارة شرطة ميامي 
ديد لمحاربة الجريمة؟ 
-٥‏ ماذا تعني «الصورة الكبيرة تبدأ صغيرة» في هذه الحالة؟ اشرح. 


ع-؟ مفاهيم وتطبيقات التنقيب في البيانات: 

لقد أصبحت عملية التنقيب في البيانات - وهي تقنية جديدةٌ ومثيرةٌ لم تظهر إلا منذ بضع 
سنوات فقط - عمليةً شائعةً تمارسها أكثرُ المنظمات. وف مقابلة أجرتها مجlة Computerworld‏ 
مع الدكتور 25م ومعة (الحائز على جائزة نوبل وعالم سابق في مختبرات 8611) في يناير 
5م قام الدكتور 420 بتحديد البيانات المُستخرّجة من القواعد التنظيمية باعتبارها تطبيقًا 
رئيسَا للشركات في المستقبل القريب. ورذا على سؤال قديم طرحته جريدة Computerworld‏ 
حول «ما هي التطبيقات القاتلة في الشركة؟» أجاب الدكتور 2602185 بقوله: «التنقيبٌ في 
البيانات». وأردف قائلًا: «سوف تصبح عملية التنقيب في البيانات أكثر أهميةً ولن تضطر 
الشركات للتخلص من أيّ شيءٍ يتعلق بعملائهم؛ لأن ذلك سيكون ذا قيمة كبيرة. وإذا لم تفعل 
ذلك فأنت خارج العمل». وبالمثل فقد ناقش (2006) غ01م1(8862 1002185' في مقال نشر في 
ca» ob Harvard Business Review‏ سلاح إستراتيجي للشركات هو اتخاذ القرار التحليليء 
وقدّم أمثلةٌ «Marriott International «Capital Ones Amazon.com : Jis GE àJ‏ وغيرها 
من الشركات التي استخدمت التحليلات؛ لفهم عملائها بشكلٍ أفضل وتحسين سلاسل التوريد 
الموسّعة لزيادة عوائدهم على الاستثمار إلى أقصى حَدّ مع توفير أفضل خدمة للعملاء. حيث 
يعتمدُ هذا المستوى من النجاح بشكل كبير على فهم الشركة لعملائهاء وللموردين» وللعمليات 
التجارية؛ إضافةٌ إلى فهمها لسلسلة التوريد الممتدة بشكل جيد. 

ومن الممكن أن يأتي جزءٌ كبيرٌ من «فهم العميل» من خلال تحليل كمية البيانات الهائلة 
التي تجمعها الشركة. والجديرٌ بالذّكر أن تكلفة تخزين ومعالجة البيانات قد انخفضت بشكل 
كبيرٍ في الماضي القريب. ونتيجةً لذلك؛ فقد تمت كمية البيانات J à ifai‏ إلكتروني بمعدل 


Sources: Miami-Dade Police Department: Predictive modeling pinpoints likely suspects based on 
common crime signatures of previous crimes, IBM Customer Case Studies, www-03.ibm.com/software/ 
businesscasestudies/om/en/corp?synkey-C894638H25952N07; Law Enforcement Analytics: Intelligence- 


Led and Predictive Policing by Information Builder www.informationbuilders.com/solutions/gov-lea 
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هائل. ومع إنشاء قواعد بيانات كبيرة؛ فقد ظهرت إمكانية تحليل البيانات المخزّنة فيها. وقد 
كان مصطلح التنقيب في البيانات يُستخدّم في الأصل لوَصْف العملية التي يتم من خلالها اكتشاف 
أنماط غير معروفة مسبقًا في البيانات. ومنذ ذلك الحين؛ فقد امتدَّ تجاوز هذا التعريف تلك 
الحدود من قبل بعض مُورّدي البرامج ليشمل معظم أشكال تحليل البيانات؛ من أجل زيادة 
المبيعات بشعبية تسمية التنقيب في البيانات. وفي هذا الفصل؛ فإننا نوافق على أن نقبل التعريف 
الأصلي للتنقيب في البيانات. 

وعلى الرغم من أن مصطلح التنقيب في البيانات هو مصطلحٌ جديدٌ نسبيّا؛ Óp‏ الأفكار التي 
وراءه ليست جديدة؛ إذ تعود جذور العديد من التقنيات المستخدّمة في التنقيب في البيانات إلى 
التحليل الإحصائي التقليدي والذكاء الاصطناعي منذ أوائل الثمانينيات. فلماذا IS]‏ استحوذت على 
اهتمام عام الأعمال؟ فيما يلي بعض الأسباب الأكثر وضوحًا: 
- زيادة حِدَّة المنافسة على النطاق العالمي تقودها الاحتياجات المتغيرة باستمرار للعملاء وما 

يريدونه في سوق مُسْبَع بشكلٍ متزايد. 

- الاعتراف العام بالقيمة غير المستغلة المخفية في مصادر البيانات الكبيرة. 
- توحيد وتكامل سجلات قاعدة البيانات؛ مما يتيح رؤيةٌ واحدةً للعملاء. والمورّدينء والمعاملات» وما إلى ذلك. 
- توحيد قواعد البيانات ومستودعات البيانات الأخرى في مكانٍ واحد في شكل مستودع البيانات. 
- الزيادة المتسارعة في تقنيات معالجة ومستودعات البيانات. 
- انخفاض كبير في تكلفة الأجهزة والبرمجيات لمستودعات البيانات ومعالجتها. 
- التحرّك نحو عملية الإزالة (تحويل موارد المعلومات إلى شكلٍ غير مادى) من الممارسات التجارية. 

وجديرٌ بالذكر أنَّ البيانات التي يُولّدها الإنترنت تتزايدٌ بسرعة؛ من حيث الحجم والتعقيد. 
وقد تمّ إنشاءً كميات كبيرة من البيانات الجينومية» والتي تراكمت في جميع أنحاء العام. وهناك 
العديدٌ من التخمّصات التي تنتج كمياتٍ As‏ من البيانات على أساس منتظم. ولذلك يقوم 
الباحثون في المجال الطبي وا مستحضرات الصيدلانية بإنتاج مستودعات البيانات التي يمكن 
استخدامها بعد ذلك في تطبيقات التنقيب في البيانات؛ لتحديد أفضل الطرق لتشخيص ومعالجة 
الأمراض بشكلٍ دقيق» واكتشاف عقاقير جديدة ومُحسّنة. 

وعلى الجانب التجاري؛ فإن أكثر القطاعات التي تس تخدم تقنية التنقيب في البيانات» 
تتمثل في قطاعات التمويل» والبيع بالتجزئة» والرعاية الصحية؛ إذ تُستخدّم تقنية التنقيب في 


rrr‏ ذكاء الأعمال والتحليلات وعلم البيانات. منظور إداري 


التحليلات التنبؤية (1): عمليةء وطرقء وخوارزميات التنقيب في البيانات 


البيانات؛ للكشف عن الأنشطة الاحتيالية والحَدَّ منهاء لاسيما في مطالبات التأمين واستخدام 
بطاقات الائتمان (هدطكت وآخرونء 1999)؛ من أجل تحديد أأماط شراء العملاء Hoffman,)‏ 
Léig (Hoffman, 1998) gwu bl Mah atajuta (1999‏ لتحديد قواعد التداول من البيانات 
التاريخيةء والممساعدة في زيادة الربحية باستخدام تحليل سلة السوق. ويُُستخدم التنقيب في 
البيانات بالفعل على نطاق واسع؛ لتحسين التعامل مع العملاء ومع تطؤر التجارة الإلكترونية على 
نطاق واسع؛ فإن هذا الأمر لا يمكن أن يصبح أكثر إلحاحًا مع الوقت. انظر الحالة العملية 41-6 
للحصول على معلومات حول كيفية استخدام شركة ۶8€ وان«اهم1 للتحليلات التنبؤية والتنقيب 
في البيانات؛ لتحسين خدمة العملاء ومواجهة الاحتيال وزيادة الرّبح. 


حالة عملية ١-6‏ 
٩‏ هي تعزيرٌ لتجربة العملاء مع الحَد من الاحتيال؟ بالتنقيب في البيانات والتحليلات التنبؤية 

عندما بدأت الشركات المصدرة للبطاقات لأول مرة باستخدام برامج قواعد العمل 
الآلي؛ لمواجهة الاحتيال في البطاقات المصرفية وبطاقات الائتمان - كانت القيودٌ المفروضة 
على هذه التقنية واضحةٌ GL‏ اشتكى العملاءٌ من عدم قدرتهم على الدفع لرحلات 
عطلاتهم أو رحلات العمل المهمة. وتعمل 7158 على تحسين تجربة عملائها؛ من 
خلال توفير أدوات لتقليل مخاطر الاحتيال؛ إضافةٌ إلى توفير الخدمات الاستشارية؛ التي 
جعلت إستراتيجياتها أكثر فعاليةً. وتهدف Visa‏ من خلال هذا النّهج إلى تحسين تجربة 
العملاء إضافة إلى تقليل المعاملات غير الصالحة. 

وجديرٌ بالذكر أنّ الشبكة العالمية للشركة تربط آلاف المؤسسات اطالية بملايين 
التجار وحاملي البطاقات S‏ يوم. وقد كانت 7158 رائدةٌ في مجال المدفوعات 
غير النقدية لأكثر من 20 عامًا. كما كانت تدعمٌ المؤسسات المالية باستخدام تحليلات 
5 وذلك للحَدّ من الاحتيال دون إزعاج العملاء برفض الدفع دون مبرر. وعندما 
تقوم 17154 بمعالجة إحدى المعاملات؛ فإنها تقوم بتحليل ما يصل إلى 0٠١‏ متغير فريد 
بشكل فوري لتقيم مخاطر تلك المعاملة. وتستطيع الشركة باستخدام مجموعات هائلة 
من البيانات. بمافي ذلك النقاط الجديدة الاحتيالية العالمية وأنماط المعاملات - أن 
تُحدّد بدقة ما إذا كنتَ تشتري في باريس. أو أن شخصاً آخر سرق بطاقة الائتمان 
الخاصة بك. وقد ذكر Nathan Falkenborg‏ ;5:5 حلول الأداء في 7/158 بشمال آسيا 
أن: «ما يعنيه ذلك هو أنه إذا كنتَ ستسافر على الأرجح؛ فنحن نعرف ذلك ونخبر 
مؤسستك المالية حتى لا يتم رفضك في نقطة البيع». وأضاف: «كما أننا سوف نساعدٌ 
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البنك الذي تتعامل معه في تطوير الإستراتيجيات الصحيحة لاستخدام أدوات التأشير 
وأنظمة تسجيل الدرجات». وتستطيع 1154 أن تقوم بعمل تحليلات البيانات الكبيرة؛ 
ومن المحتمل ان تستطيع النماذج الحديثة وأنظمة تسجيل الدرجات مَنْعَ ماقيمته 
۲ مليار دولار سنوياً من حجم المدفوعات المزوّرة. 

gus 4 Visa Axis‏ به عالميّاه وتسهّل 1/154 تحويل الأموال إلكترونيًا من خلال 
المنتجات ذات العلامة التجارية التي يُصدرها الآلاف من شركاء المؤسسات اطالية. وقد 
قامت الشركة بمعالجة 16,5 مليار صفقة EV Fais elà Ollas Cg eY- VE ple È‏ 
تريليون دولار مع بطاقة فيزا في نفس العام. 

كما أنَّ 17158 لديها القدرة على معالجة 0٠٠٠‏ رسالة معاملة في الثانية الواحدة. 
وهذا الرّقم أكبر من أربعة أضعاف معدل الذروة الفعلي للصفقة حتى الآن. ولا تقوم 
58 بالمعالجة والحساب فقط؛ بل هي تستخدم باستمرار التحليلات لتبادل الرؤى 
الإستراتيجية والتشغيلية مع مؤسساتها امالية الشريكة ومساعدتها في تحسين الأداء. 
eus‏ دَعُم هدف هذا العمل من خلال نظام إدارة بيانات قوي. وإضافةً إلى ما سبق؛ فإن 
فيزا تساعدٌ عملاءها على تحسين الأداء من خلال تطوير وتقديم رؤية تحليلية عميقة. 

edel JI oU] ead Uo» :Falkenborg Joa‏ من خلال إجراء التجميع والتجزئة 
على مستوى دقيق, ونحن نقدَّم هذه الرؤية لشركائنا في المؤسسات امالية, إنها طريقةٌ 
فعَّالة لمساعدة عملائنا على التواصل بشكلٍ أفضل وتعميق فهمهم للعميل». 

وكمثال على الدّعم التسويقي؛ فقد ساعدت 17158 العملاء على الصعيد العالمي في 
Visa gie la) eA ol cazo gil Mal gdl yaos‏ مختلف. يقول 28هطمععلله1: 
«يُعَدُ فهم دورة حياة العملاء ga Kal‏ للغايةء وتوفر في زا معلومات للعملاء الذين 
يساعدونهم في اتخاذ الإجراءات وتقديم المنتج المناسب للعميل المناسب قبل أن يصبح 
عرض القيمة متقادمًا». 

كيف هكن لاستخدام التحليلات التي في الذاكرة أن تُحدث فرقًا؟ 

تستخدم 1/159 مؤخرًا حلاً dais SAS oa eII Jle‏ على الحوس بة في الذاكرة 
لتشغيل الخوارزمية الإحصائية. glos‏ الآلةء ثم تقديم المعلومات بشكلٍ مرفي؛ إذ تقلّل 
التحليلاتٌ في الذاكرة من الحاجة إلى نقل البيانات وتنفيذ المزيد من عمليات تكرار 
النموذج؛ مما يجعلها أسرع وأكثر دقةً. 
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Falkenborg cà—asg‏ الحلّ على أنه مثل حفظ المعلومات. بدلا من الاضطرار 
للذهاب إلى خزانة الملفات لاستردادها. فيقول: «التحليلات في الذاكرة تأخذ فقط 
عقلك وتجعله أكبر. كل شيءٍ يمكن الوصول إليه على الفور». 

وفي نهاية المطاف؛ فإن التحليلات القوية تساعد الشركة على القيام بأكثر من مجرد 
عملية المدفوعات. يقول ع04طمع!501: «يمكننا تعميق محادثة العميل وخدمة عملائنا 
بشكلٍ أفضل؛ من خلال مجموعة البيانات الضخمة والخبرات الكبيرة في مجال استخراج 
بيانات المعاملات» نحن تستخدم قدراتنا في الاستشارات والتحليلات لمساعدة عملائنا في 
مواجهة تحَدّيات الأعمال وحماية نظام الدفع. وهذا ما نفعله بتحليلات عالية الأداء». 

Í oe موضكًا: «إِنّ التحَدَّي الذي نواجهه لا يختلف‎ Falkenborg c3L 2l; 
يواجه أيّ شركة تديرٌ وتستخدم مجموعة البيانات الضخمة؛ فهو يتمثل في كيفية‎ 455 
استخدامنا لجميع المعلومات اللازمة لوَمْع حَلَّ للتحَدّيات التي تواجه الأعمال - سواء‎ 
كان ذلك من شأنه تحسين نماذج الاحتيال لديناء أو مساعدة العميل على التواصل بشكلٍ‎ 
أكثر فعاليةً مع زبائنه». ثم استطرد قائلًا: «تمكّننا التحليلات في الذاكرة من أن نكون‎ 
نظام تحليلي؛ حيث يكن لبياناتنا ولعلماء القرار‎ ٠٠١ أكثر فطنةٌ؛ مع سرعة معالجة‎ 
لدينا التكرار بشكلٍ أسرع».‎ 

وتسمحٌ التحليلات التنبؤية السريعة والدقيقة لشركة 7/154 بتقديم خدمة أفضل 
للعملاء؛ إضافةً إلى خدمات استشارية مُتخصّصة؛ مما يساعدهم على النجاح في صناعة 
المدفوعات المتغيرة سريعًا بشكل يومي. 

أسئلة للمناقشة: 

-١‏ ما هي التحَذَّيات التي واجهتها 7715 وباقي صُّناعَ بطاقات الائتمان؟ 

-٠‏ كيف تمكّنت 1/158 من تحسين خدمة العملاء مع الاحتفاظ بتحسين الاحتيال؟ 

la -Y‏ هي التحليلات في الذاكرة» ولماذا تُعَد ضرورية؟ 
Source: "Enhancing the customer experience while reducing fraud (SAS* Analytics)‏ 
High-performance analytics empowers Visa to enhance customer experience while‏ - 


reducing debit and credit card fraud." Copyright o 2016 SAS Institute Inc., Cary, 
NC, USA. Reprinted with permission. All rights reserved. 
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التعريفات» والخصائصء والفوائد: 
إِنّْ مصطلح التنقيب في البيانات ببساطة؛ هو مصطلحٌ يُسِتَخدّم لوَضْف اكتشاف أو «استخراج» 
المعرفة من كميات كبيرة من البيانات. وبالقياس؛ فإنه عند النظرء يستطيع المرء أن يدرك بسهولة 
ól‏ مصطلح التنقيب ف البيانات ليس صحيحًا؛ إذ إنه يُطلّق على استخراج الذهب من الصخور أو 
التراب» ويُشار إليه باسم استخراج «الذهب» بدلا من الاستخراج «الصخري» أو «الترابي». ولذلك؛ 
فقد كان الأصحٌ أن يُقال: «استخراج المعرفة» أو «اكتشاف المعرفة» بدلا من التنقيب في البيانات. 
وعلى الرغم من عدم التوافق بين المصطلح ومعناه؛ فقد أصبح التنقيبٌ في البيانات هو اختيار 
الأغلبية. فالعديدٌ من الأسماء الأخرى المرتبطة بالتنقيب في البيانات تشمل: استخراج المعرفة, 
وتحليل النمط وعلم الآثار. وحصاد المعلومات» والبحث عن الأنماطء وتجريف البيانات. 
ومن الناحية الفنية؛ فإن عملية التنقيب في البيانات هي عمليةٌ تس تخدم تقنيات إحصائية 

ورياضية» وأساليب الذكاء الاصطناعي لاستخلاص وتحديد المعلومات المفيدة والمعرفة (أو الأماط) 
الفرعية من مجموعات كبيرة من البيانات» ومن ا ممكن أن تكون هذه الأنماط في شكلٍ قواعد العمل 
أو الانتماءات أو الارتباطات أو الاتجاهات أو ماذج التنبؤ (انظر: 2001 .(Nemati and Barko,‏ 
ومعظم الأدبيات تُعرّف التنقيبّ في البيانات بأنه: «عمليةٌ غير بديهية لتحديد أنماط صالحة 
وجديدة ومفيدة ومفهومة في نهاية المطاف في البيانات المخرّتة في قواعد البيانات المنظمة»؛ إذ 
يتم تنظيمٌ البيانات في سجلات منظمة من قبل المتغيرات الفئوية والترتيبية والمستمرة Fayyad)‏ 
وآخرونء 1997 ص .)6١-6١‏ وفي هذا التعريف؛ نجد أن معاني المصطلح الأساسي كما يلي: 
- تشي العملية إلى أن التنقيب في البيانات يضم العديد من الخطوات المتكررة. 
- غير بديهي؛ بمعنى أن هناك بعض عمليات البحث أو الاستنتاج من نوع التجارب؛ بمعنى أنه 

ل as‏ مثل حساب الكميات المحدّدة مسبقًا. 
- صالح؛ بمعنى أن الأنماط المكتشفة يجب أن تنطبق على البيانات الجديدة بدرجة كافية من اليقين. 
- غير مألوفة؛ بمعنى أن الانماط مم تكن معروفةٌ من قبل للمُستخدم في سياق النظام الجاري تحليله. 
- الفائدة المحتمّلة؛ وتعني أنَّ الأنماط المكتشّفة يجب أن تؤدي إلى فائدة بعيدة للمستخدم أو اللهمة. 
- وأخيرًا؛ مفهوما؛ بمعنى أنّ النمط يجب أن يكون منطقيًا من الناحية التجارية إلى الدرجة التي 

تجعل المُستخدم يقول: «امممم يبدو الآمر معقولًا؛ لماذا لم أفكر في ذلك» وإن م يكن هذا على 

الفور, فعلى الأقل بعد تحليل بعض نتائج العمل». 
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Ól‏ التنقيبَ في البيانات ليس نظامًا جديدًا؛ بل هو تعريفٌ جديدٌ لاستخدام العديد من 
التخصّصات؛ إذ يتم وَضْعِ بيانات الاستخراج بشكلٍ مُحكّم عند تلاقي العديد من التخصصات» 
والتي تشمل الإحصاء والذكاء الاصطناعي وتعلم الآلة وعلوم الإدارة ونظم المعلومات (15) وقواعد 
البيانات (انظر الشكل ١-٤‏ إذ إِنَّ عملية التنقيب في البيانات تسعى جاهدةٌ إلى التحسين في 
استخراج المعلومات والمعارف المفيدة من قواعد البيانات الكبيرة عن طريق استخدام التقدُّم في 
جميع التخصّصات السابقة. وعلى الرغم من أن هذا المجال لا يزال في بداياته؛ فإنه جذب إليه 
الكثيرٌ من الاهتمام في وقتٍ قصير للغاية. 





علم الإدارة 














شكل :١-١‏ التنقيب في البيانات 9 ga jo‏ من التخصصات اممتعددة 
وفيما يلي الخصائصٌ والأهداف الرئيسية للتنقيب في البيانات: 
- غالبًا ما يتم دفن البيانات في أعماق قواعد البيانات الكبيرة جدًاء والتي تحتوي أحيانًا على بيانات 
bde jo‏ سنوات. وفي العديد من الحالات؛ فإن تنظيف البيانات وتوحيدها يتح في مستودع 
البيانات؛ إذ يكن تقديمٌ البيانات بتنسيقات متنوعة (انظر: الفصل ١‏ لتصنيف موجز للبيانات). 
- بيئة التنقيب في البيانات؛ هي عادةً بنية العميل/ الخادم» أو بنية IS‏ على الويب. 
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- تساعد الأدوات الجديدة المتطوّرة. والتى تشمل أدوات التصوير المتقدّمة, على إزالة مصادر 
المعلومات المدفونة في ملفات الشركة أو السّجلات العامة الأرشيفية. والبحث عن ذلك يشمل 
تدفق ومزامنة البيانات؛ للحصول على النتائج الصحيحة. كما يستكش ف العمال المتقنون 
للتنقيب ف البيانات أيضًا جدوى البيانات الضعيفة (أيْ: النص غير المُنظّم المُخرّن في أماكن 
مثل قواعد بيانات ء٠٤0‏ 5ناأ1:0آ أو الملفات النصية على الإنترنت أو الشبكات الداخلية على 
مستوى اطؤسسة). 
- غالبًا ما يكون عاملٌ التنقيب في البيانات مُسِتَحْدَمًا نهائيّه ويتمُ تمكينه بواسطة مثاقيب البيانات 
وأدوات الاستعلام القوية الأخرى لطرح أسئلة مُخصّصة والحصول على إجابات بسرعة؛ وذلك 
من خلال استخدام مهارة برمجة محدودة أو منعدمة. 
- وكثيرًا ما ينطوي التنقيبٌ ا موس ع في البيانات على إيجاد نتيجة غير متوقعة» ويتطلب من 
المستخدمين النهائيين التفكيرٌ بصورة إبداعية خلال العملية» بما في ذلك تفسير النتائج. 
- يتم الجَمْع بين أدوات التنقيب في البيانات بسهولة مع جداول البيانات وأدوات تطوير البرمجيات 
الأخرى. وبالتالي؛ يمكن تحليلٌ البيانات المتحصّل ggg de pa) Us pis dale.‏ 
- نظرًا للكميات الكبيرة من البيانات وجهود البحث المكثفة؛ فإنه من الضروري في بعض الأحيان 
استخدام المعالجة المتوازية للتنقيب في البيانات. 
ومكن للشركة التي تستفيدٌ بشكل فخّال من أدوات وتقنيات التنقيب في البيانات؟ الحصول 
bts ue‏ تنافسية إستراتيجية والحفاظ عليه إذ يُوفّر التنقيبُ في البيانات للمنظمات بيئةٌ 
مُعرّزة لاتخاذ القرارات لاستغلال الفرص الجديدة عن طريق تحويل البيانات إلى سلاح إستراتيجي. 
ولتفاصيل أكثر حول فوائد التنقيب في البيانات انظر: (2001) .Nemati and Barko‏ 
كيف يعمل التنقيب في البيانات؟ 
من خلال استخدام البيانات الحالية ذات الصّلة والتي تم الحصولٌ عليها من داخل وخارج 
المنظمة؛ يستطيع التنقيبٌ في البيانات أن يبني نماذج لاكتشاف الأنماط بين السّمات المعروضة 
في مجموعة البيانات. وهذه النماذجُ هي التمثيلات الرياضية (العلاقات/ الارتباطات الخطية 
البسيطة أو العلاقات المعقّدة وغير الخطية) التي تحَدّد الأأماط بين سمات الأشياء (كالعملاء أو 
الأحداث) الموضّحة في مجموعة البيانات. Aa‏ هذه الأنماط تفسيرية (تشرح العلاقات المتبادلة 
والصّلات بين السّمات)» في حين أن البعض الآخر تنبوثية (تُنبَّ بالقيّم المستقبلية لبعض السّمات). 
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وبشكلٍ عام؛ فإن التنقيبَ في البيانات يسعى إلى تحديد أربعة أنواع رئيسية فقط من الأنماط: 
-١‏ تحديد الترابط في مجموعات مشتركة من الأشياءء مثل: البيرة والحفاضات تسير معا في تحليل 

سلة السوق. 
-١‏ التنبؤات تُوضّح طبيعة الأحداث المستقبلية لأحداث معينة بناءً على ما حدث في الماضيء مثل: 

التنبؤ Super Bowl $ SWL‏ أو التنبؤ بالحرارة ال مطلقة في يوم معين. 
- التجميع ويعملٌ على تحديدٍ المجموعات الطبيعية للأشياء استنادًا إلى خصائصها ال معروفة 

مثل: تعبين العملاء في شرائح مختلفة بناءً على التركيبة السكانية وسلوكيات الشراء السابقة. 
6- العلاقات التسلسلية» وتعمل على كَشْف علاقات الأحداث الزمنية» مثل التنبؤ بأن عميلا 

مصرفيًا موجودًا لديه بالفعل حساب فحص سيفتح حساب توفير متبوعًا بحساب استثمار في 

غضون عام. 

وقد تم استخراج هذه الأنواع من الأنماط يدويًا من البيانات من قبل البشر على مدى قرون» 
غير أن تزايد حجم البيانات في العصر الحديث جعل هناك حاجة إلى طرق أكثر تلقائية. ومع ازدياد 
حجم مجموعات البيانات وتعقيدها؛ ازداد التحليل المباشر للبيانات اليدوية 2 ES JS‏ باستخدام 
أدوات معالجة البيانات الآلية وغير المباشرة التي تستخدم منهجيات وأساليب وخوارزميات 
Liig Saizi‏ لمظاهر مثل هذا التطور من الوسائل الأوتوماتيكية وشبه الأوتوماتيكية بلعالجة 
البيانات الكبيرة باسم التنقيب في البيانات. 

وبشكل عام؛ فإنه يمكن تصنيف مهام التنقيب في البيانات إلى ثلاث فئاتٍ رئيسيةء هي: التنبق 
والارتباط والتجميع. واستنادًا إلى الطريقة التي يتم بها استخراج الأماط من البيانات التاريخية؛ 
تمكن تصنيف أنظمة تعلّم خوارزميات التنقيب في البيانات إلى التنقيب في البيانات في وجود 
إشراف أو بدون إشراف» وتشتمل بيانات التدريب على كلّ من الصفات الوصفية (أَيْ: المتغيرات 
al Lad‏ أو متغيرات القرار) إضافةٌ إلى خاصية الفئة (أيْ: متغير احرج أو متغير النتيجة). 
وفي المقابل؛ فمع التعلَّم بدون إشراف. فإن بيانات التدريب تشمل فقط الصفات الوصفية. 
ويوضح الشكل ١-6‏ تصنيقًا بسيطًا مهام التنقيب في البيانات» جنبًا إلى جنب مع أساليب التعلّم 
والخوازميات الشائعة لكلّ مهمة من مهام التنقيب في البيانات. 
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شكل 1-6: تصنيف مُبسّط لهام وطرق وخوارزميات التنقيب في البيانات 

- التنبؤ: يُشار إلى التوقع عادةً على أنه إخبارٌ عن المستقبل. وهو يختلف عن التخمين 
البسيط بعدَّة أشياءء مثل: مراعاة الخبرات والآراء والمعلومات الأخرى التي لها صِلةٌ بالتنبؤ. وهناك 
مصطلحٌ آخر يرتبط عادةً بمصطلح التنبؤ هو التوفّع, وعلى الرغم من اعتقاد الكثيرين أن هذين 
المصطلحين مترادفان؛ فإنَّ هناك اختلاقًا دقِيقًا بل حاسماً بين المصطلحين. فالتنبؤ يُستخدّم إلى i‏ 
كبير في الإشارة إلى الخبرة والرأي» في حين أن التوقع هو البيانات والنموذج القائم. ومن أجل زيادة 
الثقة يمكن للمرء أن يدرج المصطلحات التي لها صلةٌ ببعضها. مثل: التخمينء والتنبؤء والتوقع 
على التوالي. وفي مصطلحات التنقيب في البيانات؛ يتم استخدامٌ التنبؤ والتوقع بشكلٍ مترادف» 
ويُستخدّم مصطلح التنبق باعتباره التمثيل المشترك للفعل. وتبعًا لطبيعة ما يتم التنبؤ به؛ فإنه 
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يكن تسمية التنبؤ بش كل أكثر تحديدًا على أنه تصنيفٌ (حيث يكون الثيء الذي يتم التنبؤ به 
مثل: تنبؤات الغد والتي aas‏ حالة الجو إلى «ممطر» أو «مشمس») أو انحدارٌ (حيث يتم التنبق 
بشيء. مثل: درجة حرارة الغد. والتي تكون عبارة عن رقم حقيقيء مثل «10 درجة فهرنهايت»). 

- التصنيف: ويُقصّد به التصنيف أو الإشراف التعريفيء وهو الأكثر شيوعًا في جميع مهام 
التنقيب في البيانات. والهدف من التصنيف؛ هو تحليلٌ البيانات à Aj A oou b]‏ قاعدة 
البيانات وإنشاء نموذج تمكنه التنبؤ بالسلوك المستقبلي تلقائيًا. ويتكوّن هذا النموذج المستحدّث 
من تعميمات لسجلات مجموعة بيانات التدريبء والتي تساعد على تمييز الفئات المُحدّدة مسبقًا. 
ونأمل أن يُستخدّم هذا النموذج بعد ذلك للتنبؤ بفئات السجلات الأخرى غير المصنّفة, والأهم 
من ذلكء للتنبؤ بدقة بالأحداث المستقبلية الفعلية. وتشمل أدوات التصنيف الشائعة: الشبكات 
العصبية وأشجار القرارء والتحليل اللوجستي وتحليل التمييز (من الإحصاءات التقليدية)» 
والأدوات الناشئة, مثل: المجموعات الخامء (SVMS) psl daio Og‏ والخوارزميات الجينية. 
وقد تلقت تقنيات التصنيف القائمة على الإحصاء (على سبيل المثال: الانحدار اللوجستي وتحليل 
التمييز) نصيبها من الانتقادات - وهي أنها تضع افتراضات غير واقعية حول البيانات» مثل: 
الاستقلالية والوضْع الطبيعي - مما يَحِدّ من استخدامها في مشاريع التنقيب في البيانات من النوع 
التصنيفي. وتنطوي الشبكات العصبية على تطوير هياكل رياضية (تشبه إلى حَدّ ما الشبكات 
العصبية البيولوجية في الدماغ البشري) والتي لديها القدرة على التعلّم من التجارب السابقة 
المقدمة في شكل مجموعات بيانات جيدة التنظيم. فهي تمي ل إلى أن تكون أكثر فعاليةٌ عندما 
يكون عد المتغيرات المعنيّة كبيرًا إلى 45 ما والعلاقات فيما بينها معقدة وغير دقيقة. وجديرٌ 
بالذكر أن الشبكات العصبية لها عيوبٌ كما أن لها مزايا. فعلى سبيل المثال: bole‏ ما يكون من 
الصعب للغاية توفير Ob‏ جيدة للتنبؤات التي تقوم بها الشبكة العصبية. إضافةً إلى أن 
الشبكات العصبية تحتاج إلى تدريب كبير. ولسوء الحظ؛ فإن الوقت اللازم للتدريب يزداد 
بشكل كبير مع زيادة حجم البيانات» وبشكل عام؛ فإنه لا يمكن تدريب الشبكات العصبية على 
قواعد بيانات كبيرة جدًا. وهذه العوامل وغيرها ساعدت على تحديث إمكانية تطبيق الشبكات 
العصبية في امجالات الغنية بالبيانات. 

وتقوم أشجارٌ القرار بتصنيف البيانات إلى عدد مُحدّد من الفئات بناءً على قِيّم متغيرات الإدخال. 
وأشجار القرار؛ هي في الأماس aas‏ هرمي للبيانات ثم تكون أسرع بشكلٍ ملحوظ من الشبكات 
العصبية. فهي أكثر ملاءمةً للبيانات الفئوية والفترة الزمنية. ولذلك؛ فإن دَمْج المتغيرات المستمرة في 
إطار شجرة القرارات يتطلب تفكيرًا؛ أيْ: تحويل المتغيرات الرقمية القيّمةَ المستمرة إلى النطاقات والفئات. 
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aul Ui‏ ذات الصّلة من أدوات التصنيف؛ فهي استقراءٌ القاعدة. وهي على عكس شجرة 
القراره ومع استقراء القاعدة؛ فإن العبارات حينئذٍ تنج عن بيانات التدريب مباشرة ولا يجب 
أن تكون ذات طبيعة هرمية. وهناك تقنياتٌ أخرى SVM d ts duas‏ ومجموعات صعبة 
وخوارزميات جينية» تَحِد طريقها تدريجيًا إلى ترسانة من خوارزميات التصنيف. 

- التجميع: هو عبارة عن تجميع أقسام مجموعة من الأشياء (على سبيل المثال: كائنات» 
أحداث» معروضة في مجموعة بيانات منظمة) إلى شرائح (أو مجموعات طبيعية) يتشارك أعضاؤها 
في خصائص متشابهة. فهو على عكس التصنيف؛ إذ إِنَّ تجميع تصنيفات الفئات غير معروف. 
وإذ إِنَّ الخوارزميات تمر عبر مجموعة البيانات؛ فإن تحديد القواسم المشتركة للأشياء يتم la‏ 
على خصائصهاء ومن ثمّ يتم إنشاءٌ المجموعات. ونظرًا لأن المجموعات يتم تحديدها باستخدام 
خوارزمية من النوع التجريبي؛ ولأن الخوارزميات المختلفة قد تنتهي بمجموعات مختلفة من 
المجموعات لمجموعة البيانات نفسهاء قبل أن يتم وَضْع نتائج تقنيات التجميع للاستخدام الفعلي؛ 
فقد يكون من الضروري وجود خبير لتفسيرء وربما تعديلء المجموعات المقترحة. وبعد تحديد 
المجموعات المعقولة» يمكن استخدامها لتصنيف وتفسير البيانات الجديدة. 

وليس من المُستَغْرَب أن تشتمل تقنيات التجميع على تحقيق الدرجة المثلى. والهدف من 
التجميع هو إنشاء مجموعات؛ بحيث يكون للأعضاء داخل كلّ مجموعة أقصى درجة من التشابه 
والأعضاء عبر المجموعات لديهم الحَدٌ الأدنى من التشابه. وتتضمّن تقنيات التجميع الأكثر 
استخدامًا وسائل >1 (من الإحصائيات) وخرائط التنظيم الذاتي (من تعلّم الآلة» وهي بنيةٌ فريدة 
لاشبكة العصبية طوّرها (1982) .Kohonen‏ 

وغالبًا ما تستخدم الشركاتثٌ بفاعلية نُظّم التنقيب في البيانات لديها؛ لإجراء التجزئة في السوق 
مع التحليل التجميعي. وتحليل المجموعة؛ يُكَنُ وسيلةٌ لتحديد فنات العناصر؛ بحيث تكون 
العناصرٌ الموجودة في مجموعة مشتركة بعضها مع بعض بش كل أكبر من العناصر الموجودة في 
مجموعات أخرى. وجمكن استخدامه في تقسيم العملاء وتوجيه المنتجات التسويقية المناسبة 
إلى الشرائح في الوقت المناسب وبالشكل المناسب وبالسعر المناسب. يُستَخدّم تحليل ا مجموعة 
أيضًا؛ لتحديد التجمُعات الطبيعية للأحداث أو الكائنات؛ بحيث يمكن تحديدُ مجموعة مشتركة 
من سمات هذه المجموعات لوصفها. 

- الاقتران: إِنَّ الجمعيات. أو تعلّم قواعد الترابط في التنقيب في البيانات؛ تقنيةٌ شائعةٌ ومدروسةٌ 
جِيدًا لاكتشاف العلاقات المثيرة بين المتغيّرات في قواعد البيانات الكبيرة. وبفضل تقنيات جَمْع 
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البيانات الآلية. مثل: ماسحات الباركود؛ فإن استخدام قواعد الرّبط لاكتشاف الإجراءات المنتظمة 
بين المنتجات في المعاملات الكبيرة التي سجّلتها أنظمة نقاط البيع في محلات السوبر ماركت أصبحت 
مهمة في اكتشاف معرفة مشتركة في صناعة البيع بالتجزئة. وفي سياق صناعة البيع بالتجزثة: غالبًا 
ما يُطلّق على الاستخراج الخاص بقواعد الارتباطات: تحليل السوق. وهناك اثنان من المشتقات 
الشائعة الاستخدام؛ وهما: رابطة الاستخراج من القاعدة وتحليل الارتباط وتسلسل الاستخراج. 
وباستخدام تحليل الارتباطات» ex‏ اكتشاف الارتباط بين العديد من الأشياء ذات الأهمية تلقائيًاء 
مشل الارتباط بين صفحات الويب والعلاقات المرجعية بين مجموعات مؤلفي النشرات الأكادهية. 
ومع الاستخراج التسلسلي؛ يتم فَخص العلاقات؛ من حيث ترتيب حدوثها لتحديد الجمعيات مع 
مرور الوقت. وتتضمّن الخوارزميات امُستخدّمة في استخراج القاعدة المشتركة sàJ! Apriori‏ 
(حيث يتم التعرّف على العناصر $24( -Edlts ZeroRg OneRs FP-Growths‏ 

التصويرٌ والتنبّو بالسلسلة الزمنية؛ هناك تقنيتان ترتبطان في الغالب بالتنقيب في البيانات؛ 
وهما التصويرٌ والتنبؤ بالسّاسلة الزّمنية. ويمكن استخدامٌ التمثيل المرئي بالاقتران مع تقنيات 
التنقيب في البيانات الأخرى؛ للحصول على فَهْم أكثر وضوحًا للعلاقات الأساسية. ومع ازدياد 
أهمية التصوير في السنوات الأخيرة؛ ظهر مصطلحٌ جديدٌء وهو التحليلات المرئية. وتكمُّنْ الفكرة 
في الجَمْع بين التحليلات والتصوير في بيئة واحدة لتسهيل إنشاء المعرفة بشكلٍ أسهل وأسرع. وقد 
تمّ تغطية التحليلات المرئية بالتفصيل في الفصل ". وفي توقع السلسلة الزمنية؛ تتكوّن البيانات 
من sil ed‏ نفسه الذي يتم التقاطه وتخزينه مع مرور الوقت في فواصل زمنية منتظمة. ثم 
يتم استخدام هذه البيانات لتطوير نماذج التوقع لاستقراء القيم المستقبلية للمتغير نفسه. 


التنقيب في البيانات مقابل الإحصاءات: 

هناك الكثيرٌ من القواسم المشتركة بين التنقيب في البيانات والإحصاءات. فكلاهما يبحث عن 
العلاقات داخل البيانات. ومعظم الناس يتصلون بالإحصائيات «أساس التنقيب في البيانات». 
والفرق الرئيس بين الاثنين؛ هو أن الإحصائيات تبدأ بفرضية مُحدّدة بدقة؛ في حين تبدأ عملية 
التنقيب في البيانات ببيان اكتشاف غير مُحدَّد المعالم. وتجمع الإحصائيات بيانات عينة (أَيْ: 
بيانات أولية) لاختبار الفرضية» في حين أنَّ التنقيب في البيانات والتحليلات تستخدم جميع البيانات 
الموجودة (أيْ: البيانات الثانوية الملاحظة في الغالب) لاكتشاف أنماط وعلاقات جديدة. وهناك 
فرق آخر يأتي من حجم البيانات التي يستخدمونها؛ إذ يبحث التنقيب في البيانات عن مجموعات 
البيانات «الكبيرة» قدر الإمكان؛ في حين تبحث الإحصائيات عن الحجم الصحيح للبيانات (إذا 
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كانت البيانات أكبر من المطلوب/ المطلوب للتحليل الإحصاتيء يتم استخدام عينة من البيانات). 
إِنّْ معنى «البيانات الضخمة» يختلف إلى حَدَّ ما بين الإحصاءات والتنقيب في البيانات. وهناك 
القليل من المئات إلى الآلاف من نقاط البيانات الكبيرة بما يكفي bie dÍ gè flay Joal‏ 
ملايين إلى بضع مليارات من نقاط البيانات تُحَذَّ كبيرةً بالنسبة لدراسات التنقيب في البيانات. 


حالة عملية ۲-٤‏ 
احتفاظ شركة 11( بذكاء وفعالية تحليلاتها في القرن الحادي والعشرين 

لقد غيّرت الثورة الرقمية كيفية تسوق الناس؛ إذ تشير الدراسات إلى أنه حتى 
العملاء التجاريين ييستخدمون المزيدَ من حلولٍ البحث عن رحلة الشراء الخاصة بهم 
عبر الإنترنت قبل ارتباطهم ببائع. ومن أجل التنافس؛ فإن بعض الشركات» مثل: شركة 
1 تقوم بتحويل نماذج المبيعات والتسويق لدعم هذه المتطلبات الجديدة. ومع 
ذلك؛ فإن القيام بهذا الأمر على نحو فعّال يتطلب حل «البيانات الكبيرة» والذي يمكنه 
تحليل قواعد بيانات الشركات جنبًا إلى جنب مع معلومات غير منظمة من مصادر مثل 
sصickstreamاc‏ والشبكات الاجتماعية. 

لقد تطؤرت اا2 لتصبح رائدة في مجال التقنية من خلال استخدام العمليات 
الفعّالة القائمة على البيانات؛ إذ كن للموظفين الحصولٌ على نتائج قابلة للقياس 
لعقود قادمة من الزمان؛ وذلك من خلال استخدام تطبيقات المؤسسات لدعم الرؤية 
x Jio «Glas! ag ads‏ إدارة علاقات العملاء (/011) وال مبيعات والمحاسبة. وعندما 
أدركت OÌ Dell‏ العملاء يقضون وقنًا أطول في البحث عن المنتجات عبر الإنترنت قبل 
الاتصال بمندوب مبيعات؛ أرادت تحديث النماذج التسويقية وفقًا لذلك؛ بحيث مكنها 
تقديم الأنواع الجديدة من الخدمات المخصّصة والدعم الذي يتوقعه العملاء. لإجراء 
هذه التغييرات» ويحتاج موظفو التسويق إلى المزيد من البيانات حول سلوك العملاء 
عبر الإنترنت. كما يحتاج الموظفون إلى طريقة أسهل لتضييق الرؤية من خلال العديد 
من أدوات ذكاء الأعمال ومصادر البيانات. وقد ذكر 211166 1260 المدير التنفيذي 
لتحليلات السوق والأفكار في 2»11 أن: «هناك العديدَ من المعلومات المتاحة عن 
عادات التسوق عبر الإنترنت وخارج الإنترنت للعملاء. نحن بحاجة فقط إلى إعطاء 
موظفي التسويق حلا سهل الاستخدام يُكنه استيعاب eUS JS‏ وتحديد الأنماط وتقديم 
توصيات حول الإنفاق على التسويق والأنشطة». 
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التحليلات التنبؤية (1): عمليةء وطرق» وخوارزميات التنقيب في البيانات 


إنشاء فريق ذكي لتعزيز عائد الاستثمار (۸01) باستخدام ذكاء الأعمال والتحليلات: 
ومن أجل تحسين إستراتيجية ذكاء الأعمال والتحليلات والاتصالات العاللية؛ فقد 
أنشأت لاه فريقًا مهما لتقنية المعلومات. كما Las‏ المديرون التنفيذيون نموذجًا ذكيًا 
للحوكمة في الفريق؛ حتى يتمكّن من الاستجابة بسرعة بمتطلبات ذكاء الأعمال المتطورة 
للموظفين ومتطلبات التحليلات وتقديم عائد استثمار سريع. فعلى سبيل المثال: نجد أنه 
إضافةً إلى امتلاك حرية التعاون مع مجموع ات الأعمال الداخلية؛ فإنه يتم تمكين فريق 
العمل من تعديل الأعمال وعمليات تقنية المعلومات باستخدام الإستراتيجيات الذكية 
والمبتكرة. كما يجبٌ أن يكرّس الفريق أكثر من “0٠‏ من جهوده لتحديد وتنفيذ المكاسب 
السريعة لذكاء الأعمال ومشاريع التحليلات التي Šole‏ ما تكون صغيرة 0 dade‏ لقائمة 
أولويات «4» بقسم تقنية ال معلومات Dell à‏ كما يجب على الفريق أيصًا أن ينفق ما 
لايقل عن >٠١‏ من وقته في التبشير داخل مجموعات الأعمال الداخلية .2 مستوى 
الوعي حول التحويلات التي تتمتع بها ذكاء الأعمال - فضلًا عن الفرص ال متاحة للتعاون. 
وقد كان أحدٌ المشروعات الأولى لفريق العمل؛ هو إيجاد حل جديدٍ لبراءات الاختراع 
والتحليل يُعرف باسم Workbench Analytics‏ وقد رگز تطبيقه المبدئي على مجموعة 
مختارة من حالات الاستخدام حول ارتباطات العملاء التجاريين عبر الإنترنت وخارجها. 
وقد تم دَعْم هذا المجهود من قبل مؤسسات تقنية المعلومات والتسويق في 2»11. 
يقول 104181 ال۴۵ مدير شركة تقنية المعلومات في شركة 1ا(1: «كانت هناك à ii‏ 
توسيع نطاق استخدام هذ! الحل لدعم العديد من أنشطة المبيعات والتسويق في أقرب 
وقتٍ ممكن. ومع ذلك؛ كنا نعلم أننا نستطيع بناء حل أكثر فعالية إذا قمنا بتطويره 
من خلال الجهود السريعة المتسارعة». 
Jai (One Massive Data Mart) e3u2 4»1s Gloslso («s‏ مصدر واحد للحقيقة: 
ومن خلال العمل بجدية مع التسويق؛ فإن مهندس و فريق العمل يستخدمون 
إستراتيجيات تطوير البرمجيات الضعيفةء والعديد من التقنيات لإنشاء سوق بيانات قابلٍ 
للتوسّع بشكلٍ dl paatai 3| SyS‏ الشامل العدية من التقنيات والأدوات لتمكين 
أنواع مختلفة من مستودعات البيانات» وا معالجة البارعة. وأنشطة التشغيل الآلي. فعلى 
سبيل المثال: يقوم ا مهندسون بمستودعات البيانات غير المُنظمة من مصادر الوثائق 
الرقمية/ الاجتماعية على الخوادم التي تقوم بتشغيل م112000 عدءدمنق؛ إذ يستخدمون 
صيغة g2 ‘Teradata Aster‏ واستكشاف كميات كبيرة من بيانات العملاء من مصادر 
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أخرى بشكلٍ فوري. وبالنسبة للعديدٍ من متطلبات تحويل البيانات والتشغيل الآلي؛ 
olas dodi St‏ استخدام برمجيات 1084 من 2611, وتحديدًا أهزهط هلة2 «Toad‏ 
Toad ias , 555 5] :Dell Statistica |J] 4 3L5l Toad Intelligence Centrals‏ 
ŻA das Data Point‏ للأعمال بلعالجة البيانات والتشغيل الآليء وهي فجوةٌ حَرِجةٌ 
في النظام البيئي. وبالنسبة للنماذج التحليلية المتقدّمة؛ فإن النظام يستخدم Dell‏ 
11 والذي يوفر إعداد البيانات والتحليلات التنبؤية واستخلاص البيانات والتعرّف 
JYI‏ والإحصاءات» وتحليلات النصوص, والتوقيح والإبلاغء ونشر النموذج ومراقبته. 
ويستفيد المهندس ون أيضًا من هذا الحل لتطوير نماذج تحليلية يكن من خلالها فحص 
جميع البيانات المتباينة وتقديم صورة دقيقة لسلوك التسوق لدى العملاء. وتوفر 
الآدوات اقتراحات لتحسين الخدمة؛ إضافةً إلى مقاييس عائد الاستثمار لإستراتيجيات 
تعدّد المنتجات التي تشمل التسويق عبر الويب واممكاممات الهاتفية وزيارات المواقع. 

وفي غضون عِدَّة أشهر كان المهندسون يستخدمون منضدة التحليلات التسويقية 
الأولية. كما قامت فرقة العمل بالتخطيط لتوسيع إمكانات الحلّ حتى تتمكّن من 
تحليل البيانات من مصادر أكثر. وتقديم تصورات إضافيةء وقياس عوائد أنشطة 
القنوات الأخرىء مثل: التغريدات. والنصوص,» ورسائل البريد الإلكترونيء ومشاركات 
وسائل الإعلام الاجتماعية. 
توفير أكثر من ۲,۵ مليار دولار في التكاليف التشغيلية: 

ومن خلال الحلول الجديدة؛ فقد قامت شركة 11ء0 بالفعل بإزالة العديد من تطبيقات 
ذكاء الأعمال الخاصة بطرف ثالث. وقد ذكر Chaitanya Laxminarayana‏ مدير برنامج 
التسويق $ a] Deil åS à‏ «على الرغم من أننا في المراحل الأولى من طرح منبر التسويق 
التحليلي؛ فإننا وفّرنا حوالي 0,؟ مليون دولار في تكاليف الاستعانة مصادر خارجية للمورّدين». 
«وإضافة إلى ذلك؛ يحصل ابموظفون على إحصاءات أسرع وأكثر تفصيلًا». ونظرًا لأن !إ6 
تقوم بتحجيم نطاق تحليل التسويق؛ فإنها ستعمل على التخنّص التدريجي من تطبيقات 
ذكاء الأعمال الأخرى التابعة لجهات خارجية؛ مما يقلل من التكاليف ويُعزّْز الكفاءة. 

تسهیل ٥,۳‏ مليون دولار في الإيرادات: 


يتمتّع موظفو التسويق الآن بالرؤية التي يحتاجون إليها لتحديد الاتجاهات الناشئة 
في ارتباطات العملاء وتحديث النماذج وفقًا 4e Laxman Srigiri S5 83 -UA‏ 
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قسم التحليلات التسويقية في شركة ااء٥:‏ «لقد حققنا بالفعل ٥,١‏ مليون دولار 
كإيرادات متزايدة من خلال إطلاق برامج تس ويقية أكثر تخصيصًا وكشف فرص جديدة 
من خلال قاعدة البيانات الكبيرة لتحليلات التسويق». «إضافةً إلى ذلك؛ لدينا برامج في 
مسارها لتوسيع نطاق هذا التأثير عِذَّة مرات في السنوات الثلاث المقبلة». 

وعلى سبيل المثال: يمكن للموظفين الآن مشاهدة جدول زمني لتفاعلات العميل عبر 
الإنترنت وبدون اتصال مع 2611, بما في ذلك عمليات cl iJ‏ وصفحات 1«©11 الخاصة بموقع 
الويب التي زارها العميل, والملفات التي قاموا بتنزيلها. وإضافةً إلى ذلك؛ يتلقى الموظفون 
اقتراحات لقواعد البيانات؛ لمعرفة وقت وكيفية الاتصال بأحد العملاء؛ إضافةٌ إلى عناوين 
۸1 لصفحات محدّدة ينبغي عليهم قراءتها لمعرفة المزيد عن التقنيات التي يبحث عنها 
العميل. يقول 1زع561: «كان من الضروري أن نفهم المتطلبات المتغيّرة؛ حتى نتمكن من 
الحفاظ على ذكائنا. والآن بعد أن أصبح لدينا هذه الرؤية؛ يمكننا بسرعة تطوير نماذج 
تسويقية أكثر فاعليةٌ توفر المعلومات المخصّصة والدعم الذي يتوقعه العملاء». 

أسئلة للمناقشة: 

-١‏ ما هو التحَذَّي $39( Sİ gila Dell 4x52‏ إلى رحلة تحليلاتها؟ 

-Y‏ ما 9 dol‏ الذي قامت شركة 0٥11‏ بتطويره وتنفيذه؟ وماذا كانت النتائج؟ 

-٠‏ كشركة التحليلات نفسهاء استخدمت 1611 عروض خدماتها لأعمالها الخاصة, 
هل تعتقد أنه من الأسهل أو الأصعب على الشركة تذوق الدواء الخاص بها؟ وضّح ذلك. 
Source: Dell: Staying agile and effective in the 21st century. Dell Case Study, software.‏ 


dell.com/casestudy/dell-staying —-agile-and- — effective-in-the-21st-century881389. 


Used by permission from Dell. 


أسئلة للمراجعة على قسم :۲-٤‏ 

-١‏ عرّف التنقيب في البيانات. واذكر بماذا يُوجَد العديدٌُ من الأسماء والتعريفات المختلفة للتنقيب في البيانات؟ 
۲- ما هي العوامل الأخيرةٌ التي زادت من شعبية التنقيب في البيانات؟ 

- هل يعن التنقيبُ في البيانات تخصصاً جديداً؟ وضح ذلك. 

ع- اذكر بعض الطرق الرئيسة وخوارزميات التنقيب في البيانات؟ 

-٥‏ ما هي الاختلافات الأساسية بين المهامٌ الرئيسة للتنقيب في البيانات؟ 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري Yev‏ 


الفصل الرابع 


٠-٤‏ تطبيقات التنقيب في البيانات: 
لقد أصبح التنقيبٌ في البيانات أداةً شائعةً في معالجة العديد من المشكلات والفرص التجارية 
المعقدة. وقد ثبت أنه ناجحٌ للغاية ومفيدٌ في العديد من المجالات. وبعضها مُبِيّن في الأمثلة 
التمثيلية التالية. والهدف من العديد من تطبيقات التنقيب في البيانات التجارية؛ هو حل مشكلة 
xls‏ أو استكشاف فرصة عمل ناشئة لخلق 8325 تنافسية EN‏ 
- إدارة علاقات العملاء: إدارة علاقات العملاء (0131©) هي امتدادٌ التسويق التقليدي. ويتمثل 
الهدف من إدارة علاقات العملاء 0834 في إنشاء علاقات فردية مع العملاء من خلال تطوير 
الفهم الدقيق لاحتياجاتهم ورغباتهم. ومع قيام الشركات ببناء علاقات مع عملائها بمرور 
الوقت من خلال مجموعة متنوعة من التفاعلات (مثل: استفسارات المنتج والمبيعات» وطلبات 
الخدمةء ومكاطمات الضمان» ومراجعات المنتجات. واتصالات وسائل التواصل الاجتماعي)؛ 
فإنها تجمع كميات هائلةٌ من البيانات. وعند الجمع بين السّمات الدهوغرافية والاجتماعية 
والاقتصادية» يمكن استخدام هذه البيانات الزاخرة با معلومات من أجل: 
-١‏ تحديد المستجيبين/ المستفيدين المحتملين للمنتجات/ الخدمات الجديدة (كتصنيف العملاء). 
- فهم الأسباب الجذرية لاستنزاف العملاء؛ لتحسين استبقاء العملاء (أيْ: تحليل التغيير). 
'- اكتشاف ارتباطات متغيّر الوقت بين المنتجات والخدمات؛ لتحقيق أقصى قدر من المبيعات 
والقيمة للعملاء. 
-٤‏ تحديد العملاء الأكثر ربحيةً واحتياجاتهم التفضيلية؛ لتعزيز العلاقات وزيادة المبيعات. 
- الخدمات المصرفية: يستطيع التنقيبُ في البيانات أن يساعدّ البنوك على القيام بما يلي: 
-١‏ أتمتة عملية طلب القرض من خلال التنبؤ الدقيق للمستفيدين الأكثر احتمالاً للتعثر. 
؟"- كشف بطاقات الائتمان المزوّرة والمعاملات المصرفية عبر الإنترنت. 
'#- تحديد سبل تعظيم قيمة العميل عن طريق بَبْع ا منتجات والخدمات التي من ol gd‏ 
يقوموا بشرائها. 
ع- تحسين العائد النقدي؛ من خلال التنبؤ بدقة بالتدفق النقدي على الكيانات المصرفية (مثل: 
أجهزة الصراف الآليء الفر وع المصرفية). ١‏ 
- البَيْع بالتجزئة والنقل والإمداد: في صناعة البيع بالتجزئة؛ يمكن استخدام التنقيب في البيانات في: 
-١‏ التنبؤ بحجم مبيعات دقيقة في مواقع البيع بالتجزثة امحَدَّدة لتحديد مستويات المخزون الصحيح. 
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-Y‏ تحديد علاقات المبيعات بين المنتجات المختلفة (مع تحليل سلة السوق)؛ من أجل تحسين 
تخطيط المتجر وتحسين ترويج المبيعات. 
-٠‏ مستويات الاستهلاك المتوقعة من أنواع مختلفة من المنتجات (على أساس الظروف الموسمية 
والبيئية) لتحسين النقل والإمداد, وبالتالي زيادة المبيعات. 
©- اكتشاف أنماط مثيرة للاهتمام في حركة المنتجات (خاصةً بالنسبة للمنتجات التي لها فترة 
صلاحية محدودة؛ لأنها عَرْضة لانقضاء الصلاحية وقابلية الاستخدام والتلوث) في سلسلة 
التوريد من خلال تحليل بيانات التعرّف على الترددات اللاسلكية والحسية (۸۴1۲). 
- التصنيع والإنتاج: يمكن للمصنّعين استخدامٌ التنقيب في البيانات JS)‏ من: 
-١‏ التنبؤ بفشل الآلات قبل حدوثها؛ من خلال استخدام البيانات الحسية (تمكين ما يُسمّى 
الصيانة المستندة إلى الشروط). 
- تحديد الشذوذ والقواسم المشتركة في نظم الإنتاج؛ لتحسين القدرة التصنيعية. 
lasi -Y‏ أنماط جديدة؛ لتحديد وتحسين جودة المنتج. 
- السّمسرة وتداول الأوراق المالية: يَستخدم الوسطاءٌ والتجارٌ التنقيب في البيانات؛ من أجل: 
-١‏ التنبؤ بوقت ومقدار تغيّر أسعار السّندات. 
1- التنبق بنطاق واتجاه تقلّبات الأسهم. 
-٠"‏ تقييم تأثير قضايا وأحداث مُعيّنة على حركات السوق JSS‏ 
ع- تحديد eias‏ الأنشطة الاحتيالية في تداول الأوراق المالية. 
- التأمين: تستخدم صناعة التأمين تقنيات التنقيب في البيانات؛ من أجل: 
-١‏ توفع مبالغ امطالبة الخاصة بتكاليف الملكية والتغطية الطبية؛ لتحسين خطط الأعمال. 
-Y‏ تحديد خطط الأسعار المُثلى على أساس تحليل المطالبات وبيانات العملاء. 
۳- التنبؤ بالعملاء الأكثر احتمالًا لشراء سياسات جديدة ذات سمات خاصة. 
ع- تحديد وَمَنْع مدفوعات المطالبة غير الصحيحة والأنشطة الاحتيالية. 
- أجهزة الحاسب والبرمجيات: يكن استخدامُ التنقيب في البيانات في: 
-١‏ توقع حالات فشل مُحرّك الأقراص قبل حدوثها فعليًا. 
؟- تحديد وتصفية محتوى الويب غير المرغوب فيه ورسائل البريد الإلكتروني. 
"- اكتشاف ومَنّع ثغرات أمن شبكات الحاسب. 
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ع- تحديد منتجات البرمجيات غير الآمنة. 
- الحكومة والدفاع: يحتوي التنقيبٌ في البيانات أيضًا على عددٍ من التطبيقات العسكرية. حيث 

يمكن استخدامه في: 

-١‏ توقع تكاليف نقل الأفراد والمعدَّات العسكرية. 

- التنبق بحركات الخَصّْمء وبالتالي تطوير إستراتيجيات أكثر نجاحًا للارتباطات العسكرية. 

- التنبق باستهلاك الموارد؛ لتحسين التخطيط واطيزانية. 

ع- تحديد فئات من التجارب والإ س تراتيجيات والدروس المستفادة من العمليات العسكرية 
لتبادل المعرفة بشكلٍ أفضل في جميع أنحاء المنظمة. 

- صناعة السفر (شركات الطيرانء الفنادق/ المنتجعات, شركات تأجير السيارات): يُستَخْدّم 

التنقيب في البيانات في العديد من مجالات صناعة السفر؛ إذ يتم استخدامها بنجاح في: 

-١‏ التنبو بمبيعات الخدمات المختلفة (أنواع المقاعد في الطائراتء أنواع الغرف في 
الفنادق/ المنتجعاتء أنواع السيارات في شركات تأجير السيارات)؛ من أجل تسعير الخدمات 
على النحو الأمثل لزيادة الإيرادات إلى أقصى حَدٌ كدالة للمعاملات المتغيرة مع الوقت (يُشار 
bole lg)‏ باسم إدارة العائد). 

؟- توفع الطلب في مواقع مختلفة؛ من أجل تخصيص موارد تنظيمية محدودة بشكل أفضل. 

-٠‏ تحديد العملاء الأكثر ربحيةً وتزويدهم بالخدمات الشخصية؛ للحفاظ على أعمالهم المتكررة. 

ع- الاحتفاظ بالموظفين القيّمين من خلال تحديد الأسباب الجذرية التي تؤدي إلى تناقص 
العملاء والتصرّف بناءً على ذلك. 

- الرعاية الصحية: يحتوي التنقيبٌ في البيانات على عددٍ من تطبيقات الرعاية الصحية؛ إذ يمكن 

استخدامه في: 

-١‏ تحديد الأشخاص الذين ليس لديهم تأمينْ صحي والعوامل الكامنة وراء هذه الظاهرة غير المرغوبة. 

aad -Y‏ علاقات التكلفة/ الفائدة الجديدة بين المعالجات اللختلفة لتطوير إستراتيجيات أكثر فعالية. 

-٠“‏ توفع مستوى ووقت الطلب في مواقع الخدمة المختلفة؛ لتخصيص الموارد التنظيمية على النحو الأمثل. 

ع- فهم الأسباب الكامنة وراء تناقص العملاء والموظفين. 

- الدواء: يجب النظرٌ إلى استخدام التنقيب في البيانات في الطب باعتباره مكملًا قيمًا للبحوث الطبية 
التقليدية. والتي هي أساسًّا سريرية وبيولوجية في الطبيعة؛ إذ يمكن لتحليلات التنقيب في البيانات: 
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-١‏ تحديد أنماط جديدة لتحسين قابلية بقاء المرضى المصابين بالسرطان. 
؟- التنبق بمعدلات نجاح مرضى زرع الأعضاء لتطوير سياسات مطابقة أفضل للأعضاء. 
*- تحديد وظائف الجينات المختلفة في الكروموسوم البشري (المعروف باسم علم الجينات). 
-٤‏ اكتشاف العلاقات بين الأعراض والأمراض (وكذلك الأمراض والعلاجات الناجحة) لمساعدة 
المهنيين الطبيين في اتخاذ قرارات مستنيرة وصحيحة في الوقت المناسب. 
- صناعة أو مجال التسلية والترفيه: تستخدم صناعة الترفيه بنجاح عملية التنقيب في البيانات في: 
-١‏ تحليل بيانات المشاهد؛ لتحديد البرامج التي يتم عرضها خلال وقت الذروة. وكيفية زيادة 
العائد من خلال معرفة مكان إدراج الإعلانات. 
-Y‏ توقع النجاح اماي للأفلام قبل أن يتم إنتاجها؛ لاتخاذ قرارات استثمارية وتحسين العائدات. 
- التنبؤ بالطلب في أماكن مختلفة وأوقات مختلفة؛ من أجل تحديد مواعيد أفضل للأحداث 
الترفيهية وتخصيص الموارد على النحو الأمثل. 
-٤‏ وضع سياسات تسعير مثالية لزيادة الإيرادات. 
- الأمن الداخايء وتنفيذ القانون: يحتوي التنقيب في البيانات على عدد من تطبيقات أمن 
الأراضي وتطبيق القانون. وغالبًا ما يتم استخدام التنقيب في البيانات في: 
-١‏ تحديد أنماط السلوكيات الإرهابيةء (وللحصول على مثالٍ على استخدام التنقيب في البيانات 
لتتبّع تمويل أنشطة الإرهابيين» انظر: الحالة العملية 2-6). 
bliss! -Y‏ أنماط الجرهة (مثل: ا مواقع» والتوقيت» والسلوك الإجراميء والسّمات الأخرى ذات 
الصّلة)؛ للمساعدة في حَل القضايا الجنائية في الوقت المناسب. 
'*- التنبؤ بالهجمات البيولوجية والكيميائية المحتملة على البنية التحتية الحيوية للأمة والقضاء 
عليها عن طريق تحليل البيانات الحسّية ذات الأغراض الخاصة. 
-٤‏ تحديد وإيقاف الهجمات الضارة على الهياكل الأساسية الحيوية للمعلومات (غالبًا uh le‏ 
حرب المعلومات). 
- الرياضات: يُستخدّم التنقيبٌ في البيانات لتحسين أداء فرق الرابطة الوطنية لكرة السلة 
È (NBA)‏ الولايات المتحدة؛ إذ تستخدم فرق البيسبول الرئيسية في الدوري التحليلات 
التنبؤية والتنقيب في البيانات؛ للاستفادة على النحو الأمثل من مواردها المحدودة 
لموسم الفوز (انظر: مقالة 211م:زه310 في الفصل الأول). وفي الواقع؛ فإن معظم - إن 
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لم يكن كل - الرياضات المحترفة في الوقت الحاضر توظف خبراء البيانات كما تستخدم التنقيب 
في البيانات لزيادة فرصهم في الفوز. ولا تقتصر تطبيقات التنقيب في البيانات على الرياضات 
الاحترافية. ففي مقالة عام ۲۰۱۲م؛ قام كل من ”1ء0 sishi; Kasap (2012)3 Cogdellg‏ 
نماذج التنقيب في البيانات للتنبؤ بنتائج الرابطة الرياضية الجامعية الوطنية gls (NCAA)‏ 
لعبة الكرة باستخدام مجموعة واسعة من اللتغيرات حول إحصائيات الألعاب السابقة للفريقين 
المتعارضين (مزيدٌ من التفاصيل حول هذا يتم توفير دراسة الحالة في الفصل الثاني). وقد 
استخدم (2012) )طع181 مجموعةً متنوعةً من المتنبئين لفحص دوري بطولة كرة السَّلة 


للرجال à‏ الرابطة الوطنية لأمريكا الشمالية (a.k.a. March Madness)‏ 


حالة عملية ۲-٤‏ 
التحليل التنبؤي والتنقيب في البيانات يساعدٌُ في وقف مويل الإرهاب 

a Si‏ الهجومٌ الإرهابي على مركز التجارة العالمي في ١١‏ سبتمبر 01٠/م,‏ على أهمية 
الذكاء المفتوح المصدر. وقد أعلن قانون الوطنية الأمريكية وإنشاء وزارة الأمن الداخلي 
الأمريكية عن احتمالية لتطبيق تقنية ا معلومات وتقنيات التنقيب في البيانات؛ للكشف 
عن غسيل الأموال والأشكال الأخرى لتمويل الإرهاب. وتركّز وكالات إنفاذ القانون 
على أنشطة غسل الأموال عن طريق ال معاملات العادية من خلال المصارف وغيرها من 
منظمات الخدمات المالية. X35‏ وكالات إنفاذ القانون الآن على تسعير التجارة الدولية 
كأداة لتمويل الإرهاب. وقد استخدم تجار غسيل الأموال التجارة الدولية؛ لنقل الأموال 
بصمت خارج البلاد دون جذب انتباه الحكومة. يتم تحقيق هذا التحويل عن طريق 
المبالغة في تقدير الواردات وانخقاض قيمة الصادرات. فمثلًا يمكن للمستورد المحلي 
والمُصَدّر الأجنبي أن يشكلا شراكةً ويتجاوزا قيمة الواردات» وبالتالي تحويل الأموال من 
البلد الأم؛ مما يؤدي إلى جرائم تتعلق بالاحتيال الجمريء والتهرّب من ضريبة الدخلء 
وغسيل الأموال. ويمكن أن يكون المُصدّر الأجنبي عضوًا في منظمة إرهابية. 

وتركز تقنيات التنقيب في البيانات على تحليل البيانات المتعلّقة بمعاملات الاستيراد 
والتصدير من وزارة التجارة الأمريكية والكيانات ا مرتبطة بالتجارة. ويتم تتبّع أسعار 
الواردات التي تتجاوز الحَدّ الأقصى لأمعار الواردات ربع السنويةء وأسعار التصدير 
التي تقل عن الحَدَّ الأدنى من أسعار التصدير ربع السنوية. وينصبٌ التركيز على 
أسعار التحويل غير الطبيعية بين الجلسات التي قد تؤدي إلى تحويل الدخل والضرائب 
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الخاضعة للضريبة من الولايات المتحدة. وقد يكون الانحراف المرصود في الأمعار ناتجًا 
عن تجنّب/ تهرّب ضريبة دخلء أو غسيل أموال أو تمويل إرهاب. وقد يرجع الانحراف 
السعري المرصود أيضًَا إلى خطأ في قاعدة بيانات التجارة الأمريكية. 

Bl Sb jus‏ التنقيب في البيانات سوف يؤدي إلى تقييم فعّال للبيانات. وهو 
ما سيساعد بدوره في مكافحة الإرهاب. كما يمكن أن سهم تطبيق تقنية المعلومات 
وتقنيات التنقيب في البيانات في المعاملات المالية في تحسين المعلومات الاستخبارية. 

أسئلة للمناقشة: 

ELI GS كيف يكن استخدامٌ التنقيب في البيانات لمكافحة الإرهاب؟ اذكر ما‎ -١ 
به أيضًا غير ما تضمّنته هذه الحالة العملية.‎ 

؟- هل تعتقد أن التنقيب في البياناتء رغم أنه ضروريّ لمحاربة الخلايا الإرهابية, 
يُهدّد أيضًا حقوق الأفراد في الخصوصية؟ 
Sources: Zdanowic, J. S. (2004, May). Detecting money laundering and terrorist‏ 


financing via data mining. Communications of the ACM, 47(5), 53; Bolton, R. J. 
(2002, January). Statistical fraud detection: A review. Statistical Science, 17(3), 235. 


أسئلة للمراجعة على القسم 8-6: 

-١‏ ما هي مجالات التطبيق الرئيسة للتنقيب في البيانات؟ 

-Y‏ حَدّد على الأقل خمسة تطبيقات مُحدّدة للتنقيب في البيانات» واذكر خمسة تصنيفات مشتركة 
لهذه التطبيقات. 

۴- ما هو برأيك مجال التطبيق الأبرز للتنقيب في البيانات؟ وطاذا؟ 

-٤‏ هل كنك التفكيرٌ في مجالات تطبيق أخرى للتنقيب في البيانات م تتم مناقشتها في هذا 
القسم؟ وضح. 


٠-٤‏ عملية التنقيب في البيانات: 


Sole‏ ما يتم اتباع طريقة شائعة للقيام بمشاريع التنقيب في البيانات بشكل منهجي. واستنادًا 
إلى أفضل الممارسات؟ قام الباحثون والممارسون في مجال التنقيب في البيانات باقتراح عدة عمليات 
(سَيْر عملء أو مقاربات بسيطة خطوة بخطوة)؛ لزيادة فرص النجاح في تنفيذ مشاريع التنقيب 
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في البيانات. وقد أَدّت هذه الجهود إلى العديد من العمليات القياسية: وفي هذا القسم سنذكر 
وَضْف بعضها (عددُ قليلٌ من أكثر هذه العمليات شيوعًا). 

وقد تمّ اقتراحٌ إحدى هذه العمليات الموحّدة التي يمكن اعتبارها الأكثر شيوعًاء وهي عمليةٌ 
قياسيةٌ عبر صناعة التنقيب في البيانات (08158-014) في منتصف التسعينيات من قبل الاتحاد 
الأوروبي للشركات للعمل كمنهجية غير مسجّلة الملكية للتنقيب في البيانات CRISP-DM,)‏ 
3). ويوضّح الشكل 6-؟ هذه العملية المقترحة. وهي سلسلة من ست خطوات تبدأ بِقَهْم 
جِيد للأعمال والحاجة إلى مشروع التنقيب في البيانات (أيْ: مجال التطبيق)» وتنتهي بنشر الحل 
الذي يلبّي المتطلبات المحَدَّدة لاحتياجات العمل. وعلى الرغم من أن هذه الخطوات متسلسلةٌ 
في الطبيعة: غير أنه عادةً ما يكون هناك قدرٌ كبيرٌ من التراجع. ونظرًا لأن التجربة والخبرة؛ هي 
التي تُحرّك التنقيب في البيانات» وفقًا لحالة المشكلة وا معرفة/ خبرة المحلل؛ فإنه من الممكن أن 
تكون العملية بِرّمّتها متكرّرة للغاية (على سبيل المثال: يجب على المرء أن يتوقع أن يتنقل من 
خلال الخطوات عدة مرات) وتستغرق وقتاً طويلاً. ونظرً؛ لأن الخطوات اللاحقة مبنيةٌ على نتائج 
الاختبارات السابقة؛ فإنه يجبٌ على المرء أن يُولي اهتمامًا إضافيًا للخطوات السابقة؛ من أجل عدم 
وَضْع الدراسة بالكامل على مسار غير صحيح منذ البداية. 

















شكل ع-": عملية 2158-2131© ذات الست خطوات للتنقيب في البيانات 
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الخطوة -١‏ فهم الأعمال: 

إن العنصرٌَ الرئيس في أي دراسة للتنقيب في البيانات؛ هو معرفة ماهية الدراسة. Vas‏ 
الإجابة عن هذا السؤال بِقَهْم شامل للحاجة الإدارية للمعرفة الجديدة ومواصفات صريحة لهدف 
العمل فيما يتعلق بالدراسة التي سيتمٌ إجراؤها. فنحن بحاجة إلى أهداف مُحدّدة مثل: «ما 
هي الخصائص المشتركة للأفراد الذين فقدناهم لمنافستنا في الآونة الأخيرة؟» أو «ما هي الملامح 
النموذجية لأعوانناء وكم القيمة التي يوفرها كلّ منهم لنا؟». ثم يتم تطويرُ خطة مشروع لإيجاد 
مثل هذه المعرفة التي تِحَدَّد الأشخاص المسؤولين عن جمع البيانات» وتحليل البيانات» والإبلاغ 
عن النتائج. وفي هذه المرحلة المبكرة؛ يجب أيضًا إنشاء ميزانية لدعم الدراسة: على الأقل عند 
مستوى عالٍ مع أرقام تقريبية. 


الخطوة ؟- فهم البيانات: 

إن دراسة التنقيب في البيانات مُخصّصة للتصَّدَّي dag‏ عمل مُحدَّدة تحديدًا جيدًا. وتتطلّب 
مهام العمل المختلفة مجموعاتٍ مختلفةً من البيانات. وبعد فهم الأعمال؛ فإن النشاط الرئيس 
لعملية التنقيب في البيانات يتمثل في تحديد البيانات ذات الصَّلةَ من العديد من قواعد البيانات 
المتاحة. ويجبٌ النظر في بعض النقاط الأساسية في مرحلة تحديد البيانات واختيارها. ويجبٌُ أولًا 
وقبل كلّ شيء. أن يكون المحلل واضحاً وموجرًا حول وَضْف مهمة التنقيب في البيانات؛ بحيث 
يمكن تحديدٌ البيانات الأكثر صلةً. فعلى سبيل المثال: قد يسعى مشروعٌ استخراج بيانات تجارة 
التجزئة إلى تحديد سلوكيات الإنفاق للمتسؤقات الإناث اللاتي يقمن بشراء الملابس الموسمية على 
أساس التركيبة السكانيةء ومعاملات بطاقات الائتمانء والسّمات الاجتماعية والاقتصادية. علاوةٌ 
على ذلك؛ يجب على المحلّل بناء فهم واع بلصادر البيانات (مثل: أين يتم تخزينٌ البيانات ذات 
العلاقة؟ وفي أيّ شكلٍ؟ وما هي عملية جَمْع البيانات - الآلي مقابل اليدوي - ومَنْ هم جامعو 
البيانات؟ وكم مرةً يتم تحديث البيانات؟) والمتغيرات (مثل: ما هي المتغيرات الأكثر ملاءمةٌ؟ 
هل هناك أي متغيّرات مترادفة أو متشابهة؟ هل المتغيّرات مستقلةً بعضها عن بعض؟ هل تقف 
كمصدر معلومات كامل دون تداخل أو تعارض معلومات؟). 

ولفهم البيانات بشكل أفضل؛ فإنه Áo gna irs pai aa la JU‏ متنوعةٌ من التقنيات 
الإحصائية والرسومية» مثل: ملخصات إحصائية بس يطة لكل متغير (فمثلًا: للمتغيرات الرقمية 
ÍI ga SE Jas Bugia‏ الأدنى أو الأقصى والوسيط والانحراف المعياري المقاييس المحسوبة؛ في 
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حين أنه بالنسبة للمتغيرات الفئوية» فإنه يتم حسابُ جداول الشكل والتردد)» وتحليل الارتباط 
وقطاعات الانتشارء والمدرج الإحصايء ومؤشرات الصندوق. إن التحديد الدقيق لمصادر البيانات 
واختيارها والمتغيرات الأكثر ملاءمةً تكن أن تسهل على خوارزميات التنقيب في البيانات اكتشاف 
أنماط المعرفة المفيدة بسرعة. 

وتمكن أن تتنوعً مصادر البيانات؛ من أجل انتقاء البيانات. ومن الناحية التقليدية؛ فإن 
مصادر البيانات لتطبيقات الأعمال تشمل كلاً مما يأقي: البيانات الدهموغرافية (مثل: الدخل, 
التعليم» عدد المنازلء والعمر). والبيانات الاجتماعية (مثل: الهوايات» وعضوية النادي» والترفيه» 
وبيانات المعاملات (كسجل المبيعات, والائتمان إنفاق البطاقة, والشيكات المصدرة) وما إلى ذلك. 
às‏ الوقت الحاضر؛ فإن مصادر البيانات تستخدم أيصًا مستودعات البيانات الخارجية (المفتوحة 
أو التجارية)» ووسائط الإعلام الاجتماعية» والبيانات المُنشأة آليًاء 

كما يكن تصنيف البيانات على أنها كميةٌ ونوعية؛ إذ يتم قياس الكمية باستخدام القيم 
الرقمية: أو البيانات الرقمية. وقد تكون منفصلةً (مثل: الأعداد الصحيحة) أو مستمرة (مثل الأرقام 
الحقيقية). وتحتوي البيانات النوعية: وامعروفة أيضًا بالبيانات الفئوية» على البيانات الاسمية 
والترتيبية. فالبيانات الاسمية لها قيمٌ غير مرتبة مُحدّدة (على سبيل المثال: بيانات النوع الاجتماعي» 
التي لها قيمتان: ذكورٌ وإناث). البيانات الترتيبية لديها قيمٌ مُحدَّدة منتهية. على سبيل المثال: تُعَدُ 
تقييمات العملاء الائتمانية بيانات ترتيبية؛ لأن التقييمات يمكن أن تكون ممتازة وعادلة كما هكن 
أن تكون سيئةً. وقد وَرَدَ في الفصل ١‏ تصنيفٌ بسيط للبيانات (أيْ: طبيعة البيانات). 

وجمكن تمثيل البيانات الكمية بسهولة عن طريق نوع من توزيع الاحتمالات؛ إذ يَصف توزي 
الاحتمالات كيف يتم تشتيت البيانات وتشكيلها. فعلى سبيل المثال: عادةٌ ما تكون البيانات 
المورّعة متماثلة ويُشار إليها عادةً على أنها منحنى على شكل جرس. كما تكن تشفيرُ البيانات 
النوعية إلى أرقام ثم وَصْفها من خلال توزيعات التردد. وبمجرد اختيار البيانات ذات الصّلة وفقاً 
لهدف الأعمال التجارية للتنقيب في البيانات. يجب متابعة معالجة البيانات. 


الخطوة "- إعداد البيانات: 

l‏ الغرض من إعداد البيانات (والذي يُطلّق عليه ole‏ اسم المعالجة الأولية للبيانات) هو 
أَخْذْ البيانات المحَدّدة في الخطوة السابقة وإعدادها للتحليل بواسطة طرق التنقيب في البيانات. 
ومقارنةً بالخطوات الأخرى في 08155-224؛ فإن المعالجة المسبّقة للبيانات تستهلك معظم 
الوقت والجهد؛ ويعتقد الكثيرون أنَّ هذه الخطوة تمثل ما يقرب من ۸٠‏ من إجمالي الوقت 
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الذي يقضيه في مشروع التنقيب في البيانات. والسبب في هذا الجهد الهائل الذي يتم إنفاقه على 
هذه الخطوة هو حقيقة أن بيانات العالم الحقيقي غير مكتملة بشكل عام (أيْ: تفتقر إلى قيم 
السّماتء أو تفتقر إلى سمات مُعيّنة للاهتمامء أو تحتوي على بيانات مُجمّعة فقط). أو صاخبة 
(أيْ: تحتوي على أخطاء أو أخطاء خارجية)» وغير متناسقة (أيْ: تحتوي على تناقضات في الرموز 
أو الأمماء). وقد ورد شرحٌ طبيعة البيانات والمسائل المتعلّقة بعمليات المعالجة المُسبّقة لبيانات 
التحليلات بالتفصيل في الفصل الثاني. 
الخطوة 6- بناء النماذج: 

وفي هذه الخطوة يتم اختيارٌ تقنيات النمذجة المختلفة وتطبيقها على مجموعة بيانات Qj‏ 
إعداذها بالفعل لتلبية احتياجات العمل المحَدَّدة. وتشتمل خطوة بناء النموذج أيضًا على التقييم 
والتحليل المقارن لمختلف النماذج المبنية. ونظرًا لعدم وجود طريقة أو خوارزمية أفضل معروف 
عاميًا لمهمة التنقيب في البيانات؛ فإنه يجب على المستخدم استخدامٌ مجموعة متنوعة من أنواع 
النماذج القابلة للتطبيق جنباً إلى جنب مع إستراتيجية تقييم وتجربة مُحدّدة تحديدًا جيدًا 
لتحديد الطريقة «الأفضل» لغرض معين. وحتى بالنسبة لطريقة واحدة أو خوارزمية واحدة؛ 
فإنه يجب Jaos‏ عدد من ال معلمات للحصول على أفضل النتائج. وقد تحتوي بع الأساليب 
على متطلبات مُحدّدة في الطريقة التي يتم بها تنسيق البيانات؛ وبالتالي؛ فإن العودة إلى خطوة 
إعداد البيانات تكون ضروريةٌ في كثير من الأحيان. وتقدّم الحالة العملية 6-6 دراسة &x ioy‏ 
فيها تطوير عدد من أنواع النماذج ومقارنتها بعضها ببعض. 

وتبعًا لاحتياجات العمل؛ فإنه يمكن أن تكون مهمة التنقيب في البيانات للتنبؤ (إما التصنيف 
أو الانحدار) أو اقتران أو نوع تجميع. كما يكن لكل من هذه المهام التنقيب في البيانات من 
خلال استخدام مجموعة متنوعة من الخوارزميات وأساليب التنقيب في البيانات. وقد تناولنا 
شرح بعض طرق التنقيب في البيانات في جزء سابق من هذا الفصل» وسوف نتناول لاحقًا في هذا 
الفصل وَصْف بعض أكثر الخوارزميات استخدامًاء بمما في ذلك شجرات القرار k-meanss «Àjuazl)‏ 
لتجمع الحلولء وخوارزمية ۲1هام لاستخراج قواعد الارتباط. 


الخطوة 0- الاختبار والتقييم: 
في هذه الخطوة؛ يتم تحديدٌ وتقييمُ النماذج المتقدّمة من حيث دقتها وجدارتها؛ إذ تقوم هذه 
الخطوة بتقييم الدرجة التي يُلبّي بها النموذج (أو النماذج) المخَدّدة أهداف العملء وإذا كان الأمرٌ 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري yov‏ 


الفصل الرابع 


كذلك؛ فإلى أيّ مدى (أَيْ: هل هناك حاجةٌ إلى تطوير المزيد من النماذج وتقييمها؟). وهناك خيارٌ 
آخرء وهو اختبارٌ النموذج (أو النماذج) المتقدّم في سيناريوهات العالم الحقيقي في حالة ما إذا كانت 
قيود الوقت والميزانية تسمح. وعلى الرغم من أنه من المتوقع أن ترتبط نتائج النماذج المتقدّمة 
بأهداف العمل الأصلية؛ فإنَّ النتائج الأخرى التي لا ترتبط بالضرورة بأهداف العمل الأصليةء قد 
تكشف النقاب عن معلومات إضافية أو تلميحات للاتجاهات المستقبلية التي يتم اكتشافها. 


وتْعَدُ خطوة الاختبار والتقييم مهمةً حرجةٌ وصعبةٌ؛ إذ يتم إضافة أيّ قيمة بواسطة مهمة 
التنقيب في البيانات؛ حتى يتم التعرف على قيمة الأعمال التي تم الحصولٌ عليها من أنماط المعرفة 
المكتش فة والتعرف عليها. فتحديد القيمة التجارية من أنماط امعرفة المكتشفة يشبه إلى حَذَّ ما 
لعب الألغاز. وأنماط المعرفة المستخلصة؛ هي أجزاءٌ من اللغز والتي يجبٌ أن يتم تجميعها في سياق 
غرض العمل المحَدّد. ويعتمد نجاح عملية تحديد الهوية على التفاعل بين مُحللي البيانات ومُحلَلي 
الأعمال وصانعي القرار (مثل مديري الأعمال). ونظرًا لأن مُحلَلي البيانات قد لا يكون لديهم الفهم 
الكامل لأهداف التنقيب ف البيانات وما يعنيه لرجال الأعمالء ومُحلَّلي الأعمال» كما أن صانعي 
القرار قد لا يكون لديهم المعرفة التقنية لتفسير نتائج الحلول الرياضية المعقدة؛ ولذلك فإن التفاعل 
بينهم أمرٌ ضروري. ولتفسير أنماط المعرفة بشكلٍ صحيح؛ غالبًا ما يكون من الضروري استخدام 
مجموعة متنوعة من تقنيات الجدولة والتصور (على سبيل المثال: الجداول المحورية الجدولة 
المتقاطعة للنتائج» المخططات الدائرية» المدرج التكراريء مخططات الأرضء نقاط التشتت). 


الخطوة 5- النّشر: 

إن تطويرٌ وتقييمَ النماذج ليس نهاية مشروع التنقيب في البيانات. وحتى إن كان الغرض من هذا 
النموذج هو الحصول على استكشاف بسيط للبيانات؛ فإن المعرفة المكتَسَبة من مثل هذا الاستكشاف 
ستحتاج إلى تنظيم وتقدهها بطريقة تجعل المستخدم النهائي قادرًا على فهمها والاستفادة منها. وبناءً 
على المتطلبات؛ فإن مرحلة النشر قد تكون بسيطةً مثل إنشاء تقرير أو معقدة مثل تنفيذ عملية 
التنقيب ف البيانات القابلة للتكرار عبر المؤسسة. وفي العديد من الحالات؟ يكون العميلٌ» وليس 
مُحلّل البيانات» هو الذي يُنَفُذْ خطوات النشر. ومع ذلك فحتى إذا لم يقم المحلّل بتنفيذ جهد النشر؛ 
فمن الهم أن يفهم العميلٌ في البداية ما هي الإجراءات التي يتعَيّن القيام بها لاستخدام النماذج التي 
تم إنشاؤها فعليًا. وقد تتضمّن خطوة النشر أيضًا أنشطة الصيانة للنماذج التي تم نشرها. نظرًا 
لأن كلّ شيءٍ يتعلق بالأعمال يتغير باستمرار؛ فإن البيانات التي تعكسٌ أنشطة الأعمال تتغير أيضّاء 
وبمرور الوقت؛ قد تصبح النماذج (والأنماط المضمّنة بها) المبنية على البيانات القدهة عتيقةٌ أو غير 
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ذات صلة أو مضللة. ولذلك فمن ال مهم مراقبة النماذج وصيانته ا إذا أصبحت نتائج التنقيب في 
البيانات جزءًا من الأعمال اليومية وبيئتها. ويساعد الإعدادٌ الدقيق لإستراتيجية الصيانة على تجنّب 
فترات طويلة غير ضرورية من الاستخدام غير الصحيح لنتائج التنقيب في البيانات. ولمراقبة نشر 
نتيجة (نتائج) التنقيب في البيانات» يحتاج اممشروع إلى خطة مُفضَّلةَ حول عملية المراقبة» والتي قد 
faga Os Y‏ بسيطةً بالنسبة لنماذج التنقيب في البيانات المعقدة. 


حالة عملية ٤-٤‏ 
يساعد التنقيب في البيانات في أبحاث السرطان 

وفقاً لجمعية السرطان الأمريكية؛ فإن نصف الرجال وثلث النساء في الولايات 
المتحدة الأمريكية سيصابون بالسرطان خلال حياتهم؛ ومن المتوقع أن يتم 
تشخيص 1,06 مليون حالة سرطان جديدة في عام 17١١م. QU sa ol JI Axis‏ 
أكثر أسباب الوفاة شيوعًا في الولايات المتحدة والعال ولا يتجاوزه سوى أمراض 
القلب والأوعية الدموية فقط. ومن المتوقع في هذا العام أن يموت أكثر من 
٠‏ أمريكي بسبب السرطان - وهذا يعني أكثر من ١٠١‏ شخص في اليوم - 
وهو ما هثل حالة وفاة واحدة من كلّ أربع حالات. 

والسرطان هو مجموعةً من الأمراض يتم #مثيلها بشكلٍ عام عن طريق النمو 
غير المنضبط وانتشار الخلايا غير الطبيعية. وإذا لم يتم التحكّم في النمو و/ أو 
الانتشار؛ فقد يؤدي ذلك إلى الوفاة. على الرغم من عدم معرفة الأسباب الدقيقة, 
ومن المُعتقد أن السرطان ناتجٌ عن عوامل خارجية (مثل: التبغ؛ والكائنات المعدية, 
والكيميائيةء والإشعاعية) والعوامل الداخلية (مثل: الطفرات الوراثيةء والهرمونات 
والظروف المناعية والطفرات التي تحدث بسبب التمثيل الغذائي). وقد تعمل 
هذه العوامل السّببية معًا أو في تسلسلٍ لبَدْء أو تعزيز التسرطن. ويتم التعامل 
مع السرطان بالجراحة» والإشعاع, والعلاج الكيمياي» والعلاج بالهرمونات, والعلاج 
البيولوجيء والعلاج الموجّه. وتختلف إحصاءات البقاء على قيد الحياة بشكلٍ كبيرٍ 
حسب نوع السرطان ومرحلة التشخيص. 

de säl Ji za ol‏ قيد الحياة للدة ه سنوات لجميع السرطانات آخدٌ في 
التحسّنء كما أن معدل وفيات السرطان قد انخفض إلى “٠٠١‏ في عام ١17‏ ام 
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وهو ما أذَّى إلى تجنّبٍ حوالي 1.7 مليون حالة وفاة بسبب السرطان منذ 
عام ١1۹۹م.‏ ويعني هذا أن أكثر من 6٠١‏ شخص يتم إنقاذهم يوميًا! ويعكس 
التحسّن الذي طرأ على عدد الأشخاص الذين يتم إنقاذهم مدى التقدّم في 
تشخيص بعض أنواع السرطان في مرحلة مبكرة والتحسينات في العلاج. غير أننا 
ما زلنا بحاجة إلى مزيد من التحسينات لمنع وعلاج السرطان. 

وعلى الرّغم من أن أبحاث السرطان كانت ذات طابع سريريٌّ وبيولوجي في 
العادة؛ فإن الدراسات التحليلية المستندة إلى البيانات أصبحت مُكمُّلَا شائعًا في 
السنوات الأخيرة. وقد تمّ تحديدٌ اتجاهات البحوث الجديدة في المجالات الطبية؛ 
إذ تمّ تطبيق الأبحاث التي تعتمدُ على البيانات والتحليلات بنجاح» وذلك من 
أجل تعزيز الدراسات السريرية والبيولوجية. وقد تمكّن الباحثون من تحديد 
أنماط جديدة باستخدام أنواع مختلفة من البيانات» ها في ذلك البيانات التجريبية 
الجزيئية: والسريرية» والمرتكزة على الأدبيات (الكتابات التي كُتبت في هذا 
الموضوع). ومعلومات التجارب الشّريرية» إلى جانب أدوات وتقنيات التنقيب في 
البيانات المناسبة» وقد تمكّن الباحثون من تحديد أنماط جديدة؛ مما مممّد الطريق 
نحو مجتمع خالٍ من السرطان. 

وفي إحدى الدراسات استخدم (2009) ١1ء(‏ ثلاث تقنيات شائعة للتنقيب 
في البيانات؛ وهي: (أشجار القرارء والشبكات العصبية الاصطناعية» وآلة المتجهات 
الداعمة) بالتزامن مع الانحدار اللوجستي (المنطقي) لتطوير نماذج التنب للقدرة 
على البقاء مع وجود سرطان البروستاتا. وقد تضمّنَت مجموعة البيانات حوالي 
سجل و/ل/ا متغيرًا. كما تمّ استخدام منهجية التحقق المتقاطع س - جزء 
(1014->1) في بناء النماذج والتقييم والمقارنة. وقد أوضحت النتائجٌ أن نماذج 
المتجهات الداعمة؛ هي الأكثر دقة (مع دقة ضبط تبلغ 557,80“) لهذا المجال» 
تليها الشبكات العصبية الاصطناعية وأشجار القرار. وعلاوةٌ على ذلك؛ وباستخدام 
طريقة تقييم تعتمد على الحساسية - التحليليةء كشفت الدراسة أيضًا عن أنماط 
جديدة تتعلق بالعوامل التي تُنذر بوجود سرطان البروستاتا. 

وفي دراسة ذات صلة استخدم فيها «Kadam (2005) 9 Walker g Delen ¿yo js‏ 
اثنين من خوارزميات استخراج البيانات» وهي: (الشبكات العصبية الاصطناعية, 
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وأشجار القرار) والانحدار اللوجستي (المنطقي) لتطوير نماذج التنبؤ لبقاء سرطان 
الثدي باستخدام مجموعة كبيرة من البيانات (أكثر من ۲٠٠,٠٠١‏ حالة). وباستخدام 
منهجية التحقق المتقاطع المكوّنة من ٠١‏ أجزاء لقياس التقدير غير المتحيّز لنماذج 
التنبؤ لأغراض مقارنة الأداء - أشارت النتائجُ إلى أن شجرة القرارات (خوارزمية (C5‏ 
كانت أفضل طريقة تنبق مع دقة 95,7 على العينة اب مخالفة (والتي كانت أفضل 
طريقة تنبؤ كرت ف الأدبيات) تليها الشبكات العصبية الصناعية مع دقة 
۲ والانحدار اللوجستي (منطقي) مع دقة ۸۹۲. وقد كشف المزيد من 
التحليل لنماذج التنبؤ عن أهمية تنبؤات العواملء والتي يمكن استخدامها بعد 
ذلك كأساس لمزيد من الدراسات البحثية السريرية والبيولوجية. 

وفي الدراسة الأخيرة؛ قام Zadeh (2015)5 .Delens .Zolbanin à Js‏ 
بدراسة تأثير الاعتلال ا مشترك في البقاء على قَيْد الحياة للسرطان. وعلى الرغم من 
أن الأبحاث السابقة أظهرت أن التوصيات التشخيصية والعلاجية يمكن أن تتغير 
بناءً على شدة الأمراض المصاحبة» غير أن الأمراض المزمنة لا تزال قيد البحث بمعزل 
بعضها عن بعض في معظم الحالات. ولتوضيح أهمية الأمراض المزمنة المتزامنة 
في أثناء العلاج؛ فقد استخدمت دراستهم المراقبة, وعلم الأوبئة» والنتائج النهائية 
(558:5:10) لإنشاء مجموعتين من البيانات الطرضية: إحداهما لسرطانات الثدي 
والأعضاء التناسلية للإناث» والأخرى لسرطانات البروستاتا والسرطانات البولية. 
ثم يتم تطبيق العديد من تقنيات تعلّم الآلة الشائعة على مجموعات البيانات 
الناتجة لبناء نماذج تنبؤية (انظر: شكل 6-6). وقد أظهرت مقارنة النتائج أن 
الحصول على مزيد من المعلومات حول الحالات المرضية للمرضى يمكن أن يحسّن 
من القدرة التنموية لدى النماذجء والتي بدورها يمكن أن تساعد الممارسين على 
اتخاذ قرارات أفضل في التشخيص والعلاج. ولذلك؛ فقد اقترحت الدراسة أن 
التحديد السليم وتسجيل واستخدام حالة الاعتلال المشترك للمرضى يمكن أن يقلل 
تكاليف العلاج ويخفف من التحَدّيات الاقتصادية المتعلقة بالرعاية الصحية. 
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وتُظهر هذه الأمثلة (ضمن العديد من الدراسات الأخرى في الأدبيات الطبية) أنه 
يمكن استخدام تقنيات دقيقة للبيانات المتقدّمة لتطوير نماذج تمتلك درجةً عاليةٌ 
من القدرة التنبؤية والتفسيرية. وعلى الرغم من أن أساليب التنقيب في البيانات 
قادرةٌ على استخراج الأنماط والعلاقات المخبّأة في أعماق قواعد البيانات الطبية 
الكبيرة والمعقّدة دون التعاون والتغذية المرتدة من الخبراء الطبيين؛ فإن نتائجها 
ليست مفيدةً بشكل كبير؛ إذ يجبٌ تقبيم الأنماط الموجودة عبر أساليب التنقيب 
في البيانات من قبل المتخصّصين في المجال الطبي الذين لديهم سنوات من الخبرة 
في مجال المشكلة؛ لتحديد ما إذا كانت منطقيةً وقابلةَ للتطبيق ومبتكرةً مما يكفي 
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لتبرير اتجاهات بحثية جديدة. وباختصار؛ فإنه لا يُقصَّد من التنقيب في البيانات 
أن تحلّ محل المهنيين والباحثين المتوسطين؛ بل تجمع جهودهم التي لا تُقدّر 
بثمن لتوفير اتجاهات بحثية جديدة مدفوعة بالبيانات ولإنقاذ المزيد من الأرواح 
البشرية في نهاية المطاف. 

أسئلة للمناقشة: 

-١‏ كيف تكن استخدامٌ التنقيب في البيانات لعلاج الأمراض في نهاية المطاف 
مثل السرطان؟ 

"ا- ما هي في اعتقادك الوعود والتحَدَّيات الكبرى التي يواجهها العاملون في 
مجال التنقيب في البيانات للمساهمة في الجهود البحثية الطبية والبيولوجية؟ 
Sources: Zolbanin, H. M., Delen, D., & Zadeh, A. H. (2015). Predicting overall‏ 
survivability in comorbidity of cancers: A data mining approach. Decision Support‏ 
Systems, 74, 150161-; Delen, D. (2009). Analysis of cancer data: A data mining‏ 
approach. Expert Systems, 26(1), 100112-; Thongkam, J., Xu, G., Zhang, Y., & Huang,‏ 
F. (2009). Toward breast cancer survivability prediction models through improving‏ 
training space. Expert Systems with Applications, 36(10), 1220012209-; Delen, D.,‏ 


Walker, G., & Kadam, A. (2005). Predicting breast cancer survivability: A comparison 
of three data mining methods. Artificial Intelligence in Medicine, 34(2), 113127-. 


عمليات ومنهجيات أخرى مُوخَّدة للتنقيب في البيانات: 

s s‏ تطبيقها بنجاح؛ فإنه يجبٌ النظر إلى دراسة التنقيب في البيانات على أنها عملية تتبع 
منهجية واحدة بدلّا من مجموعة من أدوات وتقنيات البرامج الآلية. فإضافةً إلى :CRISP-DM‏ 
هناك منهجيةٌ أخرى معروفة تمّ تطويرها من قبل معهد 545 وتُسمَّى )2009( Š$ SEMMA‏ 
يشير اختصار 55114 إلى «العينة» والاستكشاف, والتعديل, والطرازء والتقييم». 

وبدءًا من عيّنة من البيانات تم مثيلها إحصائيًا؛ فان 52۷۸4 يجعل من السهل تطبيق 
الأساليب الاستكشافية الإحصائية والتصويرء وتحديد وتحويل أهمٌ المتغيّرات التنبؤية» وتهيئة 
المتغيّرات للتنبق بالنتائج» وتأكيد دقة النموذج. وهناك تمثيلٌ مُصوّر ل 5831314 في الشكل 0-6. 
ومن خلال تقييم نتائج كلّ مرحلة من مراحل عملية 5831218؛ يمكن shb‏ النموذج تحديد 
كيفية صياغة أسئلة جديدة تثيرها النتائج السابقة. وبالتاليء العودة إلى مرحلة الاستكشاف 
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الفصل gil)!‏ 
من أجل تحسين البيانات بشكل أفضل؛ وذلك كما هو الحال مع 011158-21 ]3 يتم تشغيلٌ 
özg SEMMA‏ تجريبية متكررة للغاية. ويتمثل الفرق الرئيس SEMMA; :CRISP-DM jı‏ 
فی أن CRISP-DM‏ يتخذ منهجًا أكثر شموليةً - بما في ذلك فهم الأعمال والبيانات ذات الصّلة 
- بالقياس بمشروعات التنقيب في البيانات» في slasi of iai SEMMA gaiis ar‏ وغايات 
مشروع التنقيب في البيانات تكون معًا جنبًا إلى جنب مع تحديد مصادر البيانات المناسبة وفهمها. 





Sample Xy 
توليد عينة تمثيلية للبيانات‎ 





SEMMA 














شكل ©-0: عملية quitt SEMMA‏ في البيانات 

)]22( ما يستخدم بعض الممارسين مصطلح اكتشاف المعرفة في قواعد البيانات‎ Soles 
اكتشاف المعرفة في قواعد‎ )1997( 95,515 Fayyad كمرادف للتنقيب في البيانات. وقد عرّف‎ 
لاستخدام أساليب التنقيب في البيانات؛ للعثور على معلومات وأنماط مفيدة‎ slas البيانات بأنها‎ 
في البيانات» على عكس تعدين البيانات» والتي تنطوي على استخدام الخوارزميات لتحديد الأنماط‎ 
في البيانات المشتقة؛ من خلال عملية 121 (انظر: الشكل 5-6). حيث إِنَّ 122 هي عمليةٌ‎ 
شاملةٌ تشمل التنقيب في البيانات» ويتكون الإدخال إلى عملية 1102 من بيانات تنظيمية: كما‎ 
بكفاءة؛ لأنه يوفر مصدرًا واحدًا للبيانات التي يتم‎ KDD يتيح مستودع بيانات للمؤسسة تنفيذ‎ 
استخراجها. وقد لخَّص (2003) تمهطهدا<1 عملية 1272 على أنها تتكوّن من الخطوات التالية:‎ 
اختيار البيانات معالجة البيانات» تحويل البيانات» التنقيب في البيانات» التفسير/ التقييم.‎ 
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شكل 5-6: عملية 1191 (اكتشاف المعرفة في قواعد البيانات) 


ويوضّح الشكل 6-/ نتائج الاستطلاع للسؤالء Lo»‏ هي المنهجية الرئيسة التي تستخدمها في 
التنقيب في البيانات؟» (تم الاستطلاع عن طريق ددمء.واءعع نامكء! في أغسطس ۲۰۰۷). 











Source: Used With Permission From Kdnuggets.com 


شكل 6-/: رتب منهجيات/ عمليات التنقيب في البيانات 
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أسئلة للمراجعة على قسم 6-6: 

-١‏ ما هي عمليات التنقيب في البيانات الرئيسة؟ 

؟- لماذا تعتقدٌ أنَّ المراحل الأولى (فهم العمل وفهم البيانات) هي الأطول في مشاريع التنقيب في البيانات؟ 

- اذكر مراحل عملية «CRISP-DM‏ وعرّفها بإيجاز. 

-٤‏ ما هي الخطواتٌ الرئيسة للعالجة البيانات؟ قم بِوَصْف كلّ خطوة بإيجان مع تقديم أمثلة 
ذات صلة. 

SSEMMA s .CRISP-DM iw ll ما هو‎ -0 


0-4 طرق التنقيب فى البيانات: 

asl ss‏ من الطرق المتنوعة لأداء دراسات التنقيب في البيانات» والتي تشمل: التصنيف» 
والانحدارء والتجميع» والترابط. وتستخدم معظمٌ أدوات برامج التنقيب في البيانات أكثر من تقنية 
(خوارزمية) لكل من هذه الطرق. وفي هذا القسم نقدّم وصقًا لأساليب التنقيب في البيانات الأكثر 
شيوعًا مع شرح التقنيات التي تقوم بتمثيلها. 


التصنيف: 

ربما تكون طريقة التصنيف للتنقيب في البيانات؛ هي الطريقة الأكثر استخدامًا لمشكلات 
العام الحقيقي. وبصفتها عضوًا مشهورًا في عائلة تقنيات العام الآلي؛ فإنَّ التصنيف يتعلم أنماطًا 
من البيانات السابقة (مجموعة من المعلومات - السّمات والمتغيّرات والميزات - على العناصر أو 
الكائنات أو الأحداث المسماة سابقًا) لوضع حالات جديدة (مع بطاقات تعريف غير معروفة) في 
مجموعاتهم أو فصولهم. فعلى سبيل المثال: يمكن استخدام التصنيف للتنبؤ بما إذا كان الطقس 
في يوم معين سيكون «مشمسّا» أو «ممطرّاه أو «غائمًا»» وتتضمّن مهام التصنيف الشائعة الموافقة 
على الائتمان (أيْ: المخاطر الانتمانية الجيدة أو السيئة)ء وموقع المتجر (أيْ: هل الموقع جيد أو 
معتدلء أو سين؟). والتسويق المُسِتَهدّف (على سبيل المثال: العميل المحتمَلء أو الذي لا Jal‏ 
منه)ء وكشف الاحتيال (أيْ: نعم/ لا)» والاتصالات السّلكية واللاسلكية (معنى أنه من المحتمل أن 
يتحول إلى شركة هاتف أخرىء نعم/ لا). فإذا كان المتوقع هو تسمية فئة (مثل: «مشمس» أو 
«ممطر» أو «غائم»)؛ فإن مشكلة التنبؤ تُسِمّى تصنيفاً: في حين إذا كانت قيمة رقمية (على سبيل 
المثال: درجة الحرارة مثل: 74 درجة ۴)؛ فإن مشكلة التنبو تُسمّى انحداراً. 
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وعلى الرّغم من أنه يكن استخدامٌ التجميع (وهي طريقةٌ أخرى شائعةً للتنقيب في البيانات)؛ 
لتحديد المجموعات (أو عضوية الضَّف) للأشياء؛ فهناك فرق كبيرٌ بين الاثنين؛ إذ يتعرّف التصنيف على 
الوظيفة بين خصائص الأشياء (أيْ: المتغيّرات المستقلة) وعضويتها (أيْ: متغيّر المخرجات) من خلال عملية 
elsi‏ تحت الإشراف؛ إذ يتم تقديمٌ كلا النوعين (المدخلات والمخرجات) من المتغيرات إلى خوارزمية؛ أمًا 
في التجميع؛ فإن تعلّم عضوية الكائنات يتم من خلال عملية تعلّم غير خاضعة للإشراف؛ إذ يتم عَرْض 
مُتغْيّرات الإدخال فقط على الخوارزمية. وعلى عكس التصنيف؛ فإن التجميع ليس له آليةٌ إشرافيةٌ 
(أو مراقبة) تفرض عملية «elu‏ وبدلًا من ذلك؛ فإن الخوارزميات الخاصة بالتجميع تستخدم واحدًا 
أو أكثر من الاستدلالات (مثل: قياس المسافة مُتعدّد الأبعاد) لاكتشاف التجمعات الطبيعية للأجسام. 
وجدير بِالذُكر أنَّ منهجية الخطوتين الأكثر شيوعًا للتنبؤ بنوع التصنيف تتضمّن تطويراً/ 
تدريباً موذجياً واختباراً / نشراً نموذجياً. وفي مرحلة تطوير النموذج؛ ي يتم استخدامٌ مجموعة من 
بيانات الإدخالء بما في ذلك ملصقات الفئات الفعلية. وبعد أن يتم تدريبُ النموذج؛ يتم اختبار 
النموذج مقابل عينة الحجز لتقييم الدقة» وفي النهاية يتم نشره للاستخدام الفعلي؛ إذ يتم Sal‏ 
بفئات مثيلات البيانات الجديدة (إذ يكون تصنيف الفئة غير معروف). وعند تقييم النموذج؛ 
إن هناك عدة عوامل لا بُدّ من أخذها في الاعتبارء وتتضمَّن الآني: 
- الدّقة التنبؤية: هي قدرة النموذج على التنبؤ بشكل صحيح بتصنيف الفئة للبيانات الجديدة أو 
غير المرئية مسبقاً. ودقة التنبؤ هي عامل التقييم الأكثر استخدامًا لنماذج التصنيف. ولحساب 
هذا المقياس؛ فإنه يتخ مطابقة تصنيفات الطبقة الفعلية لمجموعة بيانات اختبار مع تصنيفات 
الفئات التي يتنبأ بها النموذج. وبعد ذلك يكن احتسابٌُ الدقة كمعدل دقةء وهي النسبة 
المئوية لعيّنات مجموعة بيانات الاختبار التي تمّ تصنيفها بشكلٍ صحيح بواسطة النموذج 
(وسوف نتناول هذا الموضوع بشيءٍ من التفصيل لاحقًا في الفصل). 

- السرعة: هي التكاليف الحسابية التي ينطوي عليها توليدٌ واستخدام النموذجء وكلما كان ذلك 
أسرع؛ ix alè‏ أفضل. 

- المتانة: هي قدرة النموذج على إجراء تنبؤات دقيقة إلى is‏ 4 معقول عندما e‏ م إعطاؤه بيانات 


صاخبة (غير دقيقة) أو بيانات ذات قيم مفقودة أو خطأ. 
- قابلية التوشّع: هي القدرة على بناء نموذج التنبؤ بكفاءة تُعطى كميةً كبيرةً من البيانات. 
- التفسير: هو مستوى الفهم والبصيرة اللذان يوفرهما النموذج (مثل: كيف أو ما يختتمه 
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تقدير الدّقة الحقيقية لنماذج التصنيف: 

يُعَذّ المصدرٌ الأماسي لتقدير الدّقة في مشكلات التصنيف؛ هو مصفوفة الدّقة (وتُسمّى أيضًا 
مصفوفة التصنيف أو جدول الطوارئ). ويُوضُح الشكل 6-6 مصفوفة الدقة طمشكلة تصنيف من 
فئتين؛ إذ تمثل الأرقام على طول القطر من اليسار العلوي إلى اليمين السفلي القرارات الصحيحة 


والأرقام خارج هذا القطر تمثل الأخطاء. 

















شكل 6-6: مصفوفة «510د)م00 بسيطة لجدولة نتائج تصنيف فثتين 
ويقدّم الجدول ١-6‏ معادلات مقاييس الدقة الشائعة لنماذج التصنيف. 


جدول 1-6: مقايبس الدّقة الشائعة لنماذج التصنيف 





الوصف 


القياس 





نسبة الحالات المصلّفة بشكل صحيح (إيجابيات 
وسلبيات) مقسومةً على إجمالي عدد الحالات. 


(TP+TN/TP) + (TN+FPFN) = ããJl 





Jo Fhalbh! Sloly åa (a.k.a. Sensitivity) 
صحيح مقسومةٌ على إجمالي العدد الموجب (أيْ: معدل‎ 
الضرب أو الاسترجاع)‎ 


معدل موجب حقیقي = TP/ (TP+FN)‏ 





Ja à all GU JI 4. 5 (aka. Specificity) 
معدل‎ G) صحيح مقسومة على العدد الإجمالي السلبي‎ 
الإنذار الخطأ)‎ 








TN/ (TN+FP) = chàs Jls Jaza 
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التحليلات التنبؤية (1): عمليةء وطرقء وخوارزميات التنقيب في البيانات 














القياس الوصف 
نسبة الإيجابيات الممصئّفة بشكلٍ صحيح مقسومةً على 
(TP/TP)4FP - el&-yl‏ مجموع الإيجابيات المصئّفة بشكلٍ صحيح والإيجابيات 
التي م تصنيفها بشكلي غير صحيح 
نسبة الإيجابيات المصنّفة بشكلٍ صحيح مقسومةٌ على 
(TP/TP)«EN - sleAzNl‏ مجموع الإيجابيات المصنّفة بشكل صحيح والسّلبيات 








وعندما لا تكون مشكلة التصنيف ثنائية؛ تزداد مصفوفة الارتباك (مصفوفة مربعة بحجم العدد 
الفريد لعناوين الفئات)» وتُصبح مقاييس الدَّقة مُحدّدة معدلات دقة الفئة ودقة التصنيف الإجمالية. 





(True Classification) 
(True Classification Rate); — 


DH p xr o. epum 
g (False Classification) 
-1 


n 
a (True Classification), 
(Overall Classifier Accuracy); — i-l لط‎ 





Total Number of Cases 


َد تقديرٌ دقة نموذج تصنيف (أو مصنّف) الناجم عن تعلّم الخوارزمية تحت الإشراف 
أمرًا مهما لسببين: أولا: هكن استخدامه لتقدير مدى دقة التنبؤ المستقبلية» والتي قد تشير إلى 
مستوى الثقة الذي يجبٌ أن يكون لدى المرء في مخرجات المصنف في نظام التنبؤ. وثانيًا: يمكن 
استخدامه لاختيار مصنف من بين مجموعة مصنّفات (تحديد نموذج التصنيف «الأفضل» بين 
مجموعة مُدرّبة).و فيما يلي بعض منهجيات التقدير الأكثر شيوعًا الممستخدّمة لنماذج التنقيب في 
البيانات بطريقة التصنيف. 

الانقسام البسيط: يُقسّم الانقسام البسيط (أو إجراء تقييم أو اختبار للعيّنة) البيانات إلى 
مجموعتين فرعيتين حصريتين متبادلتين وتُعرفان بمجموعة التدريب ومجموعة الاختبار (أو 
مجموعة التمرير)» ومن الشائع تعيينُ ثلثي البيانات كمجموعة تدريب من قبل المحفُز (مُنشن 
النموذج) ومن ثم يتم اختبار المصنّف الْدمَج على مجموعة الاختبار. ويحدث استثناءٌ لهذه 
القاعدة عندما يكون المصنف عبارة عن شبكة عصبية اصطناعية. وفي هذه الحالة؛ يتم تقسيم 
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البيانات إلى ثلاث مجموعات فرعية استثنائية: التدريبء والتحقق من الصحة. والاختبار. كما 
يتم استخدام مجموعة التحقق من الصحة في أثناء بناء النموذج لمنع التثبيث. ويوضح الشكل 
-E‏ منهجية الانقسام البسيط. 




















شكل 5-6: تقسيم البيانات العشوائية البسيطة 

ويتمثل النقدُ الأساسي لهذه الطريقة في افتراض أن البيانات في المجموعتين الفرعيتين هي من 
نفس النوع (أَيْ: لها نفس الخصائص بالضبط). ونظرًا لأن هذا التقسيم عشوائي بسيط؛ فقد لا 
يكون هذا الافتراض صحيحًا. ولتحسين هذا الوَضْع؛ فإنه يتم اقتراح أخذ العيّنات الطبقية؛ إذ 
تصبح الطبقات هي متغيرٌ المخرجات, وعلى الرغم من أنَّ هذا يُعَنّ تحسّنًا على الانقسام البسيط 
غير أنه لا يزال لديه تحير مرتبط بالتجزئة العشوائية المفردة. 

التحقق باستخدام س - أجزاء (104->1): وتُستَخدّم هذه المنهجية لتقليل التحيّز المرتبط 
با معاينة العشوائية لعيّنات بيانات التدريب والعزل في مقارنة الدقة التنبؤية لطريقتين أو أكثر. 
ds‏ هذه المنهجية. والتي يُطلق عليها أيضًا تقدير الدوران» يتم تقسيم مجموعة البيانات الكاملة 
بشكل عشوائي إلى مجموعات فرعية حصرية متبادلة متساوية الحجم تقريبًا؛ إذ يتم تدريب 
نموذج التصنيف واختباره عدد (س) من المرات. وفي كلّ مرة يتم تدريبه على جميع أجزائه؛ ولكن 
مرة واحدة ثم يتم اختبارها على الجزء المنفرد المتبقي. ويتمٌ حساب تقدير هذه المنهجية من 
الدقة الكلية للنموذج ببساطة بمتوسط مقاييس الدقة الفردية» كما هو مُوضّح في المعادلة التالية: 











ka $ 
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التحليلات التنبؤية (1): عمليةء وطرق» وخوارزميات التنقيب في البيانات 


إذ يشير C۷4‏ إلى دقة التحقق المتقاطع» و(س) هو عدد الأجزاء المستخدَمةء 5 (A)‏ هو obla‏ 
الدّقة (أيْ: Asa‏ الضرب» والحساسيةء والخصوصية) لكل جزء. يعرض الشكل ٠١-٤‏ رسمًا Ela‏ 
للتصديق المتقاطع 1-1014 إذ تمّ تعيين س على .٠١‏ 




















شكل :٠١-6‏ تصوير بياني لاختبار الصلاحية المتقاطع من عدد >1 من الطبقات 
منهجيات إضافية لتقييم التصنيف وتتضمّن منهجيات التقييم الشائعة الأخرى ما يلي: 
- الإبقاء على oÀas :Leave-one-out als‏ الطريقة تشبه ET‏ المتقاطع من 1010-]1؛ إذ 
تأخذ >1 قيمة ١؛‏ بمعنى أنه يتم استخدام JS‏ نقطة بيانات للاختبار مرة واحدة على العديد من 
النماذج المتقدّمة؛ إذ يُوجَّد عددٌُ من نقاط البيانات. وهذه الطريقة مُستَهلكة للوقت؛ غير أنها 
في بعض الأحيان تُعَنُّ خيارًا قابلًا للتطبيق بالنسبة لمجموعات البيانات الصغيرة. 
- 8أطصة]80015: ومع هذه الطريقة يتم أخذ عينات عدد ثابتٍ من النماذج من البيانات 





الأصلية (مع الاستبدال) للتدريبء وتُسِتَخدّم بقية مجموعة البيانات للاختبار. ويتم تكرارٌ هذه 
العملية عدة مرات حسب الرغبة. 

- وه قنمكلككء12: وعلى الرغم من تشابه هذه الطريقة مع منهجية Leave-one-out‏ مع احتساب 
التحصيل؛ فإنه يتح حساب الدقة من خلال ترك عينة واحدة عند S‏ تكرار لعملية التقدير. 

- المنطقة تحت منحنى ©1206: إن المنطقة تحت منحنى 1060 هي تقنية تقييم رسومية؛ إذ 
يتم تخطيط المعدَّل الإيجابي الحقيقي على المحور لا ويم رم ال معدل الإيجابي الخاص على 
اطمحور ×. وتحدد المنطقة الواقعة تحت منحنى 1100 مقياس دقة المصنف؟ إذ تشيرٌ القيمة 
١‏ إلى المصنف المثالي» في حين أنَّ ٠,‏ لا تشير إلى أكثر من المصادفة العشوائية؛ وفي الواقع؛ فإن 
القيم تتراوح بين الحالتين المتطرفتين. فمثلًا في الشكل .١١-6‏ يحتوي .4 على أداء تصنيف أفضل 
من 8 في حين أن 0 لا يكون أفضل من الفرصة العشوائية كرمي العملة. 
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المعدل الإيجابي الحقيقي (الحساسية) 
eo e‏ 
a in‏ 





1 09 08 07 06 05 04 03 02 01 0 
المعدل الإيجابي الخاطيء (1-الخصوصية ) 











شكل :١١-6‏ منحنى عينة ROC‏ 
تقنيات التصنيف تستخدم عدداً من التقنيات (أو الخوارزميات)؛ لنمذجة التصنيفء ومنها: 

- تحليل شجرة القرار: يُمكن القول بأن تحليل شجرة القرار (تقنية تعلّم (U‏ هو أكثر تقنيات 
التصنيف شيوعًا في مجال التنقيب في البيانات. وسيرد وَضْفٌ iil oda] aas‏ القسم 
التاليي من هذا الفصل. 

- تحليل إحصائي: كانت التقنيات الإحصائية عبارة عن الخوارزميات التصنيفية الأساسية: لعدّة 
سنوات؛ حتى ظهرت تقنيات Olai giáng IY eis‏ التصنيف الإحصاني الانحدار 
اللوجيستي والتحليل المميِّزِء وكلاهما من الافتراضات التي تفيد بأن العلاقات بين المتغيرات 
المدخلة والمخرجات تكون بطبيعتها خطيةًء والبيانات موزّعة بشكلٍ طبيعيء والمتغيرات ليست 
مترابطةٌ Mz cag‏ بعضها عن بعض. وقد أدّتَ الطبيعة المشكرك فيها لهذه الافتراضات إلى 
التحوّل نحو تقنيات تعلّم الآلة. 

- الشبكات العصبية: وهذه التقنية هي الأكثر شيوعًا من بين تقنيات تعدّم الآلةء والتي يكن 
استخدامها لمشكلات نموذج التصنيف. 


yvy‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات التنبؤية (1): عمليةء وطرقء وخوارزميات التنقيب في البيانات 


- الاستدلال المبني على حالة: يستخدم هذا النّهج حالات تاريخيةً؛ للتعرّف على القواسم المشتركة 
لتعيين حالة جديدة في الفئة الأكثر احتمالًا. 

oa-‏ البيزية 5و8 ذودوكء صهزوءع:زه8: يستخدم هذا النهج نظرية الاحتمال لبناء نماذج تصنيف 
تستندٌ إلى الأحداث السابقة القادرة e$ de‏ مثيلٍ جديدٍ في فئة (أو سلسلة) أكثر احتمالا. 

- الخوارزميات الجينية: ويُقصّد بها استخدامٌ تشابه التطور الطبيعي لبناء آليات مستندة إلى 
البحث لتصنيف عيّنات البيانات. ١‏ 

- المجموعات الخام: هذه الطريقة تأخذ بعين الاعتبار العضوية الجزئية لعلامات الفئات لفئات 
مُحدَّدة مُسْبِقًا في نماذج البناء (تجميع القواعد) ممشكلات التصنيف. 

والحقيقة أنَّ الوصف الكامل لجميع تقنيات التصنيف خارج نطاق هذا الكتاب؟ وبالتالي فإننا 
سوف نتناول هنا العديد من التقنيات الأكثر انتشارًا فقط. 


مجموعة نماذج لأفضل التحليلات التنبؤية: 

إِنَّ عملية إنشاء مجموعات هي في جوهرها عمليةٌ ذكية لجمع المعلومات (التوقعات أو 
التنبؤات) التي تم إنشاؤها وتوفيرها من قبل اثنين أو أكثر من مصادر المعلومات (أيْ: نماذج التنبؤ). 
es‏ الرغم من وجود جدلٍ مستمرٍ حول مستوى تطؤر أساليب المجموعة المستخدّمة؛ فإن 
هناك إجماعاً عامًّا على أن نماذج المجموعات تُنتج معلوماتٍ أكثر قوةً وموثوقيةٌ لقرارات العمل 
(Seni & Elder, 2010)‏ أي إِنَّ الجمع بين التنبؤات تكن أن (وغالبًا ما) يؤدي إلى تحسين الدقة 
وقوة نتائج المعلومات, مع الحَذَّ من الشك والتحيّز المرتبطين بالنماذج الفردية. 

وكما نعلم جميعًا أنه لا يوجد في نماذج التنقيب في البيانات والتنبؤ بها نموذجٌ يُقال عنه أنه 
«أفضل نموذج» مقبول عاميًا يناسب أيّ مشكلة؛ إذ يعتمدٌ أفضل نموذج على السيناريو الذي 
يجري تحليله ومجموعة البيانات الممستخدّمة؛ وهذا النموذج لا يكن الحصول عليه إلا من خلال 
التجربة والخطأ على نطاق واسع (وهذا لا يحدث إلا في حالة توافر الوقت واموارد). ومثلما 
لا يُوجَد نموذج واحد يمكن أن يُوصف بأنه الأفضل؟ فإنه لا يُوجَّد أيضًا أفضل تنفيذ منفرد لأنواع 
النماذج المختلفة؛ فمثلًا أشجار القرار والشبكات العصبية وآلة المتجهات الداعمة لها أساليب 
بناء ومجموعات من العوامل المتغيّرة تحتاجُ إلى «تحسين» أفضل النتائج الممكنة. ويقوم علماء 
البيانات بتطوير طرق جديدة لتحسين دقة وكفاءة نماذج التنبؤات في الوقت الحالي. وتتمثل 
إحدى الطرق المؤكدة للقيام بذلك في دَمُجٍ مخرجات نماذج التنبؤّ في نتيجة مركبة واحدةء وهي 
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g dròg degana‏ الفرق التي تستخدم مجموعة نماذج (©اادمءوم8) - الفرق التي فازت 
بالعديد من منافسات التنقيب ف البيانات والتنبؤ بالبيانات في السنوات الأخيرة - هي الفرق 
الفائزة (وللحصول على قائمة بمسابقات التحليلات والفرص التحليلية الحديثة انظر: kaggle.org‏ 

وجمكن تصنيف نماذج المجموعات إلى متجانسة أو غير متجانسة )307 (Abbott 2014, P.‏ 
وكما يُوحِي الاسم؛ فإن مجموعات النماذج المتجانسة تجمع بين نتائج نموذجين أو أكثر من 
نفس النوع من النماذج» مثل أشجار القرار. وفي الواقع؛ فإن تطوير أغلب مجموعات النماذج 
المتجانسة يتم باستخدام مزيج من هياكل شجرة القرار. وتُعَدُ فئتا التعبئة والتعزيز الفئتين 
الشائعتين من مجموعات شجرة القرار. ويُطلق على JUL‏ المعترف به بشكل كبير والذي حقق 
نجاخًا كبا في مجموعات شجرة القرار من نوع مجموعات الغابة العشوlئıة Random Forest‏ 
- بدلا من بناء شجرة كبيرة؛ إذ تتطوّر الغابة العشوائية :50565 2320072 كغابة من العديد من 
الأشجار الصغيرة. وخير مثالٍ لدعم مجموعات شجرة القرار هو 8هناه40380 (وهو اسم قصير 
ل «التعزيز التكيّفي») - وهو الخوارزمية التي تعمل على تغيير الوزن (أَيْ: الأهمية أو المساهمة) 
ا مخصص لكل عينة بيانات في كل تكرار في عملية التعلّم, والذي يستند إلى نتائج التصنيف غير 
الصحيح؛ بحيث يتم تحسينٌ دقة المصنف / المتنبئ لجميع تصنيفات الفصل. 

Ul‏ مجموعات النماذج غير المتجانسة؛ فإنها - كما يوحي اسمها - تجمع بين نوعين مختلفين أو 
أكثر من النماذج» مثل: أشجار القرارء والشبكات العصبية الاصطناعيةء والانحدار اللوجستي» وآلة 
المتجهات الداعمة. والجدير بالذكر أن استخدام النماذج التي تختلف جوهريًا بعضها عن بعض 
aod As)‏ عوامل النجاح الرئيسة في نمذجة المجموعات؛ إذ تتناول البيانات من منظور مختلف. 
ونظرًا لأن الطريقة التي تجمع بين نتائج نماذج مختلفة لأنواع مختلفة من النماذج؛ فإن ا مجموعة 
النموذجية غير المتجانسة تُسمّى أيضًا نماذج الدَّمج ds (Sharda, 20105 Delen) (lsslsll‏ 
عملية دَمْج نتائج نماذج متعددة. سواء أكانت تصويتاً بسيطاً (كل نموذج يُسهم بالقدر نفسه 
صوت واحد) أو مزيج تركيبي من التصويت (يُسهم كل نموذج بناءً على دقة التنبؤ به - النماذج 
ASVI‏ .432 لها قيمة وزن أعلى) ممكن استخدامه. وبغض النظر عن طريقة التوليفة؛ فقد نت 
أن المجموعات تمثل إضافةً لا تقدّر بثمن لأيّ مشروع للتنقيب في البيانات والنمذجة التنبؤية. 
وعلى الرغم من أنَّ النمذجة المعرَّزة تعمل على تحسين الدقة والقوة, غير أن لها جانباً سلبيً إذ 
إنها تزيدُ أيضًا من تعقيد النموذج» ومن ثم عدم القدرة على تفسيرها (أيْ: الشفافية). ويُوضَح 
الشكل 17-6 رسمًا بيانيًا لمجموعة نموذج غير متجانس. 
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شكل 17-6: توضيح بياني مجموعة غير متجانسة 

وقبل أن نوضّح تفاصيل أشجار القرار؛ فإننا نحتاجُ إلى مناقشة بعض المصطلحات البسيطة. 
أولا: تشمل أشجار القرار العديد من متغيرات المدخلات التي قد يكون لها تأثيرٌ على تصنيف 
الأنماط المختلفة. وعادةً ما مُسمّى هذه المتغيرات الُدخَّلة بالسّمات. فمثلًا إذا أردنا بناء نموذج 
لتصنيف مخاطر القروض على أساس اثنين فقط من الخصائص - الدخل والتصنيف الائتماني - فإن 
هاتين الخاصيتين ستكونان هما الصفاتء والمخرجات الناتجة ستكون هي الفئة (والتي قد تكون 
منخفضةً أو متوسطةً أو le‏ المخاطر). ثانياً: تتكون الشجرة من مجموعة من الفروع والعقد. 
ويمثل الفرع نتيجة اختبار لتصنيف نمط (على أساس اختبار) باستخدام إحدى السّمات. وتمثل 
عقدة الورقة في النهاية اختيار الفصل النهائي للنمط (سلسلة من الفروع من عقدة الجذر إلى 
عقدة الورقة» والتي يمكن تمثيلها كإشارة هعط)-؟1 معقدة). 

وتكمن الفكرة الأساسية وراء شجرة القرار في أنها تقسّم بشكل متكرّر مجموعة التدريب 
حتى يتكون ÍS‏ قسم بشكلٍ كامل أو بشكلٍ أسامي من أمثلة من فصل واحد. 59 تحتوي كلّ عقدة 
غير ورقية من الشجرة على نقطة «eL dl‏ وهي عبارة عن اختبار لواحد أو d‏ من السمات 
وتُحدّد كيفية تقسيم البيانات بشكلٍ أكبر. وبشكل sle J‏ فإن الخوارزميات الخاصة بشجرة ة القرار 
nb‏ بإنشاء شجرة مبدئية من بياناتٌ التدريب؛ بحيت ث تکون کل عقدة ة عبارة عن أوراق نقية, ثم 

تقوم بتقليم الشجرة لزيادة تعميمهاء وبالتالي دقة التنبة على بيانات الاختبار. 
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وفي مرحلة النمؤ؛ يتم بناء الشجرة عن طريق تقسيم البيانات بشكلٍ مُتكرّر حتى تصبح كل 
وحدة نقية (أيْ: تحتوي على أعضاء من نفس الفئة) أو صغيرة نسبيًا. وفكرتها الأماسية تعتمد 
على طرح الأسئلة والتي تقوم الإجابات عنها بتوفير معظم المعلومات. على غرار ما قد نفعله إذا 
لعبنا لعبة «عشرون سؤالَا». 

ويعتمد الانقسامٌ المستخدم لتقسيم البيانات على نوع السّمة المُستَخدّمة في التقسيم. وبالنسبة 
إلى السّمة المستمرة 4» تكون التقسيمات من قيمة النموذج × > (4)؛ إذ تمثل < قيمة الانقسام 
«المثلى» لى. فعلى سبيل المثال يمكن أن يكون التقسيم المبني على الدخل هو «الدخل 0٠٠٠١‏ >». 
وبالنسبة للسّمة الفئوية tA‏ فإن الانقسامات التي هي من قيمة النموذج (4) تنتمي إلى × حيث × 
هي مجموعة فرعية من 4. فمثلا يمكن أن يكون الانقسام old de‏ الجنس: «ذكر مقابل «ual‏ 

أما الخوارزمية العامة لبناء شجرة القرار؛ فهي كما xa‏ 
-١‏ إنشاء عقدة جذرية وتعيين جميع بيانات التدريب إليها. 
-١‏ تحديد أفضل سمة تجزئة. 
*- إضافة فرع إلى عقدة الجذر لكل قيمة من الانقسام؛ بحيث يتم تقسيم البيانات إلى مجموعات 

de (nonoverlapping) əla ås;‏ طول خطوط التقسيم sxt!‏ والانتقال إلى الفروع. 
ع- تكرير الخطوتين ١‏ و" لكلّ عقدة موجودة في كلّ ورقة حتى الوصول إلى معايير التوقف (فمثلا 

يتم التحكم في العقدة بتسمية فئة واحدة). 

وقد تم اقتراحٌ العديد من الخوارزميات المختلفة لإنشاء أشجار القرار. وتختلف هذه 
الخوارزميات بشكل أساسي من حيث الطريقة التي تُحدّد بها خاصية التجزئة (وقيمها 
المقسومة). وترتيب تقسيم السمات (تقسيم نفس السمة مرة واحدة فقط أو عدة مرات). وعدد 
الانقسامات عند كلّ عقدة GLS)‏ مقابل ثلاني)» ومعايير التوقفء وتقليم الشجرة (ما قبل الحرق 
.(postpruning‏ ومن أكثر الخوارزميات شهرةً نظام 1103 (متبوعة ب 04.5 و05 كنسخ معدلة 
من 123) من تعلم الآلة. والتصنيف, بالإضافة إلى أشجار الانحدار (۸۸1) من الإحصائيات» 
وكاشف التفاعل الأوتوماتيي مربع كاي oye chi-squared (CHAID)‏ التعرّف على الأماط. 

وعند إنشاء شجرة قرار؛ يكون الهدف في ÍS‏ عقدة هو تحديدٌ السّمة ونقطة الانقسام لهذه 
السمة التي تقسّم سجلات التدريب على أفضل وجه لتنقية تمثيل الفئة في تلك العقدة. ولتقييم 
سلامة الانقسام؛ فقد تم اقتراح بعض مؤشرات التقسيم. وقد ود أن أكثر مؤشرين شيوعًا هما 
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مؤشر جيني 1206 فدات وكسب امعلومات تمع information‏ حيث يُستَخدّم مؤشر جيني 
dbi) SPRINTs CART cLaj js ($ Gini index‏ للتحجيم بالتعقب الذاتي للأشجار). كما 
ex‏ استخدام إصدارات من كسب المعلومات في 123 (والإصدارات الأحدث, 04.5 و05). 

وقد استخدم مؤشر جيني 1006 1م61 في الاقتصاد لقياس تنوع السكان. كما يمكن استخدام 
نفس المفهوم لتحديد درجة نقاء فئة معينة كنتيجة لقرار التفرّع على طول سمة أو متغير معين. 
وأفضل انقسام هو الذي يزيدٌ من نقاء المجموعات الناتجة عن الانقسام المقترح. وفيما يلي 
نتناول بإيجاز حساباً بسيطاً لمؤشر جيني. 

إذا كانت مجموعة البيانات S‏ تحتوي على أمثلة من فئات «؛ فسيتمٌ تعريف مؤشر جيني 
Gini index‏ على أنه 


ginkS) — l-ap} 








حيث ز۶ هو تردد نسبي للفئة زفي 5. فإذا كانت مجموعة البيانات 5 مقسمةً إلى مجموعتين 
فرعیتین» 51 و52 بأحجام le N29 N1‏ التوالي؛ óp‏ مؤشر جيني UL Gini index‏ المقسّمة 
يحتوي على أمثلة من af de Gini index puy $o iyd oig n DLs‏ 





N 7 N, 


piniis) = "egin(S) ^. giniS;) 





حيث يتم اختيار مجموعة السمة / الانقسام التي توفر أصغر (5) انامونهزع؛ من أجل تقسيم 
العقدة. وفي مثل هذا الشأن؛ فإنه يجب سرد جميع نقاط التقسيم الممكنة لكلّ صفة. 


"n 


أمّا كسب المعلومات؛ فهو آلبة التقسيم الممستخدّمة في ID3‏ والتي ربما تكون الخوارزمية 
الأكثر شهرةٌ والمعروفة باسم شجرة القرار. وقد تمّ تطويرها من قبل صدلمنه0 1055 في e ASAT‏ 
ومنذ ذلك الحين؛ فقد قام بتطوير هذه الخوارزمية ضمن الخوارزميات 04.5 و05©. وتكمن 
الفكرة الأماسية ل 1023 (ومتغيراتها) في استخدام مفهوم b Íu entropy lugay éus‏ 
مؤشر جيني 1046 1هذت؛ حيث يقيس الانتروبيا مقدار الشك أو العشوائية في مجموعة البيانات. 
فإذا كانت جميع البيانات في مجموعة فرعية تنتمي إلى فئة واحدة فقط؛ فلا يُوجَد أي شك أو 
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عشوائية في هذه المجموعة من البيانات» وبالتالي؛ lio ja Saglig åo entropy hugy o‏ 
النهج؛ هو بناء الأشجار الفرعية بحيث تكون الإنتروبيا تإم0:]مء لكل شجرة فرعية نهائية صفر 
(أو قريبة من الصفر). وفيما يلي نتناول أيضًا حساب كسب المعلومات. 
وعلى افتراض أنَّ هناك فنتينء ۶ (موجبة) وه (سالبة). دع مجموعة الأمثلة 5 
تحتوي على عدد م من فئة 2 وعدد ه من الفئة 21. فإن كمية المعلومات المطلوبة 
لتحديد ما إذا كان المثال التعسّفي في 5 ينتمي إلى ۲ أو 1( يتم تعريفها على أنها 


p 
Kp, n) = - log, p n we, n 


ptn ptn ptn ptn 

















وبفرض استخدام السمة 4» فإنه سيتم تقسيم المجموعة 5 إلى مجموعات 4S1, S2, ..., Sv]‏ 
فإذا احتوى 51 على أمثلة ذم من ۲ وأمثلة نه من N‏ فإن الإنتروبيا entropy‏ أو ا معلومات 
المتوقعة اللازمة لتصنيف الكائنات في كل الأشجار Sl das AI‏ هي 





E(A) = APi * Pif(p,nd 
iP +n 











ومن $85 فإن ا معلومات التي سيتم اكتسابها من خلال التفرّع على السّمة 4 ستكون 
-Gain (A) = I (p,n) - E (A)‏ 

حيث يتم تكرار هذه الحسابات لكلّ سمة: كما يتم تحديدُ تلك التي لها كسب المعلومات 
العالي كسمة التجزئة. وتتشابه الأفكار الأساسية وراء مؤشرات التقسيم هذه بعضها مع بعض» 
غير أن تفاصيل الخوارزمية المُحدَّدة تختلف. وهكن العثورٌ على تعريف تغصيلي لخوارزمية 173 
وآلية تقسيمها في (1986) صفلسنت©. 

وتوضّح الحالة العملية 0-6 مدى أهمية المكاسب المتحضّل عليها إذا تمّ استخدام تقنيات 
التنقيب في البيانات الصحيحة لمشكلة عمل مُحدَّدة بشكل جيد. 
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حالة عملية ٥-٤‏ 
تستخدم شركة 8)له»11 0م106 التحليلات التنبؤية المتقدّمة للتركيز على العوامل 
التي تؤثر حقًا في قرارات الرّعاية الصحية الخاصة بالأشخاص 

8I ella aal] Janis Lelis ai Influence Health à 575 ei i‏ الوحيد في 
قطاع الرعاية الصحية؛ حيث 554 "c Influence Health à az»‏ الخدمة وأصحاب 
العمل والدافعين من التأثير إيجابًا على صّنْعِ القرار والسلوكيات الصحية للمستهلك 
يما يتجاوز إعداد الرعاية البدنية من خلال المشاركة المتعددة الشخصية والتفاعلية. 
وقد ساعدت الشركة منذ عام ١۱۹۹م‏ - ومقرها في برمنغهام بولاية ألاباما - أكثر من ١١٠١‏ 
منظمة مزوّدة في التأثير على المستهلكين بطريقة تحؤلية لتوفير التكاليف بالإضافة إلى الجودة. 

إن الرعاية الصحية هي عملٌ شخصي؛ إذ تختلف احتياجات كلّ مريض وتتطلب 
استجابة فرديةء ومن ناحية أخرى - فإنه مع استمرار ارتفاع تكاليف توفير خدمات 
الرعاية الصحية- تحتاج المستشفيات والنظم الصحية بشكل متزايد إلى الاستفادة من 
وفورات الحجم من خلال توفير الطعام لأكبر عدد من السكان؛ إذ يصبح التحَذّي عندئذ 
هو توفير نهج شخصي في أثناء العمل على نطاق واسع. كما تتخمّص شركة ععمعداكه1 
Basel s (à Health‏ عملاء قطاع الرعاية الصحية على حل هذا التحَدَّي من خلال 
التعرّف على مرضاهم الحاليين والمحتملين بشكل أفضل واستهداف كلّ فرد بالخدمات 
الصحية المناسبة في الوقت المناسب. وتسمح تقنية التحليلات التنبؤية المتقدّمة من 
BM‏ لر Health‏ uenceا1nf‏ ساعدة عملائها على اكتشاف العوامل التي لها أكبر 
تأثير على قرارات الرعاية الصحية للمرضى. ومن خلال تقييم ميل مئات الملايين من 
العملاء المتوقعين للحصول على خدمات رعاية صحية Influence Health 5$ tàoU-‏ 
قادرةٌ على زيادة الإيرادات ومعدلات الاستجابة لحملات الرعاية الصحية. وتحسين 
النتائج لعملائها ومرضاهم على حَدٌ سواء. 

استهداف اممستهلك الذكي: 

أصبحت صناعة الرعاية الصحية اليوم أكثر تنافسية من أيّ وقتٍ مضى؛ إذ إنٌ انخفاض 
استخدام خدمات المنظمة؛ يؤدي إلى انخفاض أرباحها أيصًا؛ إذ هيل المستهلكون الآن 
إلى اختيار أفضل padia‏ الرعاية الصحيةء بدلا من مجرد البحث عن أقرب مستشفى 
أو عيادة. وبالتوازي مع الجهود اممشتركة في الصناعات الأخرى؛ فإنه يجب على منظمات 
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الرعاية الصحية بذل المزيد من الجهد لتسويق نفسها بشكلٍ فعا لكل من المرضى 
الحاليين وا محتملين وبناء التواصل والولاء على المدى الطويل. 

إن مغاتيح النجاح في تسويق الرعاية الصحية؛ هي التوقيت ا مناسب والأهمية. 
فإذا كنت تستطيع التنبؤ بنوع الخدمات الصحية التي قد يحتاجها الفرد المحتمل؛ فإنه 


يمكنك المشاركة والتأثيرٌ عليه بشكلٍ أكثر deb‏ في العناية بالصحة. 

و Ravirala zó‏ لدعلا رئيس قسم التحليلات في شركة Influence Health‏ أن: 
«مؤسسات الرّعاية الصحية تخاطر بفقدان انتباه الأشخاص إذا أوصلوا إليهم رسائل 
غير ذات صلة. ونحن نساعد عملاءنا على تجنب هذا الخطر من خلال استخدام التحليلات 
لتقسيم آفاقهم الحالية وا محتملة والسوق لهم بطريقة شخصية وملائمة أكثر بكثير». 

تحليلات أسرع وأكثر مرونة: 

ومع توسّع قاعدة عملائها؛ ازداد الحجم الإجمالي للبيانات في أنظمة التحليلات في 
3S1 Ja 24 dnfluence Health‏ من ۱۹١‏ مليون سجل للمرضىء» مع سجل تفصيلي للمرض 
BÀ s‏ ملايين من المرضى. وقد علق 1516214 على ذلك بقوله: «مع وجود الكثير من 
البيانات للتحليل؛ أصبحت طريقة تسجيل البيانات الحالية لدينا معقدةٌ للغاية وتمتغرق 
وقتاً طويلاً. ولذلك فقد أردنا أن نكون قادرين على استخراج الأفكار بسرعة أكبر ودقة أكبر». 

ومن خلال الاستفادة من برمجيات التحليلات التنبؤية من 18M‏ أصبحت 
ule 5L 8 GYI Influence Health‏ تطوير نماذج تحسب مدى احتمالية أن يحتاج 
كل مريض إلى خدمات معينة وتُعبُّر عن هذا الاحتمال كنسبة مئوية. ويعتمد التقسيم 
الجزئي والعديد من النماذج الخاصة بالأمراض على البيانات الدهوغرافية والاجتماعية 
والاقتصادية والجغرافية والسلوكية وتاريخ الأمراض وبيانات التعداد وبحث الجوانب 
المختلفة لاحتياجات كلّ مريض من الرعاية الصحية المتوقعة. 

ويضيف 1820144 قائلًا: «ويتيح لنا حل 18۷ الجمع بين كل هذه النماذج 
باستخدام تقنية المجموعة؛ مما يساعد على ela‏ على قيود النماذج الفردية وتقديم 
نتائج أكثر دقةٌ؛ فهي تمنحنا المرونة لتطبيق تقنيات متعددة لحل مشكلة ما والتوصّل 
إلى أفضل حل لها. كما أنها تعمل على تنفيذ الكثير من عمليات التحليلات تلقائيًا؛ 
مما مُكّننا من الاستجابة لطلبات العملاء بشكلٍ أسرع من ذي قبل وكثيرًا ما نوفر لهم 
مستوى أعمق من البصيرة فيما يتعلق بالقطاع المرضى». 
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فعلى سبيل المثال: 255 Health‏ 1011100656 اكتشاف كيفية انتشار المرض وتنوع 
الخطر بين مجموعات مختلفة داخل عامة السكان. وذلك باستخدام تقنيات تحليل مجموعة 
معقدة للغاية, تمكن الفريق من اكتشاف أمراض الاعتلال المشتركة الجديدة التي تعمل على 
تحسين القدرة على التنبؤ بالمخاطر لأكثر من ٠٠١‏ مرض شائع بنسبة تصل إلى XA‏ 

وهذا يساعد على التفريق بثقة تامة بين اللمرضى ذوي المخاطر العالية والمعرضين 
لمخاطر عالية للغاية؛ مما يسهّل استهداف الحملات على المرضى والمحترفين الذين هم 
Qual à‏ الحاجة إليها. ومع وجود مثل هذه الأفكار في Influence (l5 &3Jl JoUze‏ 
]121 قادرةٌ على استخدام خبرتها في تسويق الرعاية الصحية لتقديم المشورة لعملائها 
حول أفضل السّبل لتخصيص موارد التسويق. 

esi» 358 Ravirala (33) 4 35‏ عملاؤنا بعمل ضوابط كبيرة للميزانية على أساس 
التوجيهات التي نقدمها لهم». «ونحن نساعدهم على زيادة تأثير حملات ممرة واحدة - 
مثل حملات سوق التأمين الصحي عند بدء ١2۲ء4‏ 0(4 - بالإضافة إلى خططهم 
الإستراتيجية الطويلة المدى والاتصالات التسويقية المستمرة». 

الوصول إلى الجمهور اممناسب: 

de Infiuence Health 45è hb selo‏ زيادة الإيرادات وتحسين الصحة 
السكانية؛ من خلال تمكين عملائها من استهداف أنشصطتهم التسويقية بشكل أكثر 
فعاليةً. ويُوضّح 22:1:018: «وبفضل العمل معنا؛ تمكّن العملاء من تحقيق عائد 
استثماري يصل إلى 1-17 من خلال التسويق المُستَهدَف بشكلٍ أفضلء لا يتعلق الأمر 
فقط بالإيرادات: فمن خلال ضمان إرسال معلومات الرعاية الصحية الحيوية إلى 
الأشخاص الذين يحتاجون إليهاء نحن نساعد عملاءنا على تحسين مستويات الصحة 
العامة في المجتمعات التي تخدمهم». 

dz Xd] Ui Jo à Influence Health 5a: 235‏ واكتساب فهم أعمق 
للسمات الحرجة التي تؤثر على قرارات الرعاية الصحية. فمع مجموعة أدوات تحليل 
مرنة في متناول يدها؛ فإن الشركة مجهزةٌ بشكل جيد للحفاظ على تحسين خدماتها 
للعملاء. ويذكر 2291018 أنه: «في المستقبل؛ نر يد أن نتعرف على بيانات المريض 
والبيانات المرتقبة إلى المستوى التاليء ونحدد أنماط السلوك وندمج التحليل مع مكتبات 
تعلم الآلة. لقد أعطتنا 18365255 بالفعل القدرة على تطبيق ودمج العديد من 
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الموديلات دون كتابة خط واحد من التعليمات البرمجية. ونحن حريصون على الاستفادة 
من B1 de‏ مع توسيع نطاق تحليلات الرّعاية الصحية لدينا لدعم النتائج السريرية 
وخدمات إدارة صحة السكان». 

ويختتم 163911812 Venky‏ رئيس قسم التحليلات في :Y58 Influence Health‏ 
«نحن نحقق تحليلات على نطاقٍ غير مسبوق. فاليوم؛ يمكننا تحليل ١90‏ مليون daw‏ 
مع 0" نموذج مختلف في أقل من يومينء وهي مهمةٌ لم تكن ممكنة لنا في الماضي». 

أسئلة للمناقشة: 

Influence Health Jذعف‎ Iذln‎ -1 

۲- ما هي التحديات والحلول المقترحة والنتائج التي تم الحصول عليها؟ 

-٠‏ كيف يمكن أن يساعد التنقيب في البيانات الشركات في صناعة الرعاية الصحية 
(بطرق أخرى غير المذكورة في هذه الحالة)؟ 
Source: Influence Health: Focusing on the factors that really influence people's‏ 


healthcare decisions. IBM Case Study, www.presidion.com/case-study-influence-health. 


التحليل التجميعي للتنقيب في البيانات: 

dad‏ التحليلٌ التجميعي طريقةٌ أساسيةٌ للتنقيب في البيانات لتصنيف العناصر أو الأحداث أو 
المفاهيم إلى مجموعات مشتركة تُسمّى مجموعات. وتُستخدّم هذه الطريقة بشكلٍ شائع في علم 
الأحياء» والطب» وعلم الوراثة. وتحليل الشبكات الاجتماعية» وعلم الإنسانء وعلم الآثارء بالإضافة 
إلى علم الفلك والتعرّف على المفاهيم» وحتى في نظم إدارة المعلومات (8115). ونظرًا لزيادة 
انتشار التنقيب في البيانات؛ فقد تمّ تطبيق التقنيات الأساسية على الأعمال؛ خاصةً على التسويق. 
كما تم استخدامٌ التحليل التجميعي على نطاق واسع؛ للكشف عن الاحتيال (كلّ من الاحتيال على 
بطاقة الائتمان والتجارة الإلكترونية) وتجزئة السوق للعملاء في أنظمة 01836 المعاصرة. ويستمر 
تطوير المزيد من التطبيقات في الأعمال؛ إذ يتم التعرّف على قوة تحليل المجموعات واستخدامها. 

إن التحليل التجميعي هو أداةٌ لتحليل البيانات الاستكشافية لحل مشكلات التصنيف. ويهدف 
إلى تصنيف الحالات (مثل: الأشخاص. والأشياء. والأحداث) إلى مجموعات أو مجموعات؛ بحيث 
تكون درجة الارتباط قويةٌ بين أعضاء نفس المجموعة وضعيفةٌ بين أعضاء المجموعات المختلفة. 
وتصف كل مجموعة الفئة التي ينتمي إليها أعضاؤها. ومن الأمثلة الواضحة في تحليل الأبعاد 
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التجميعية؛ إنشاء نطاقات درجات يكن من خلالها تعيين درجات دراسية لفئة الكلية. وهذا 
يشبه مشكلة التحليل التجميعي التي واجهتها وزارة الخزانة الأمريكية عند إنشاء أقواس ضريبية 
جديدة في الثمانينيات. مثال خيالي لحدوث التجميع في كتب هاري بوتر J. K. Rowlings‏ 
Sorting Hat 33 2$ .Harry Potter books‏ أي بيت (مبنى) لتعيين طلاب السنة الأولى à‏ 
مدرسة هوجورتس. مثال آخر ينطوي على تحديد كيفية جلوس الضيوف في حفل الزفاف. أمّا 
فيما يتعلق بمعالجة البيانات؛ فإن أهمية التحليل التجميعي هي أنها قد تكشف عن مجموعات 
وهياكل في بيانات لم تكن واضحةً من قبل ولكنها معقولة ومفيدة عندما يتم العثور عليها. 
ويمكن استخدامٌ نتائج التحليل التجميعية في: 
- تحديد نظام التصنيف (مثل: أنواع العملاء). 
- اقتراح نماذج إحصائية لوصف السكان. 
- ظهور قواعد لتعيين حالات جديدة للفصول لتحديدها واستهدافها وأغراض التشخيص. 
- توفير مقاييس التعريف والحجم والتغيير في المفاهيم السابقة. 
- البحث عن حالات نموذجية لتسمية وتمثيل الطبقات. 
- تقليل حجم وتعقيد مساحة المشكلة للطرق الأخرى للتنقيب في البيانات. 
- تحديد القيم المتطرفة في مجالٍ معين (مثل: اكتشاف الأحداث النادرة). 
تحديد العدد الأمثل للمجموعات: تتطلّب الخوارزميات التجميعية Luas ole‏ عدد المجموعات 
المطلوب العثور عليها. فإذا كان هذا الرقم غير معروف من خلال المعرفة السابقة؛ فإنه يجب 
اختياره بطريقة ما. ولسوء الحظ؛ فإنه لا تُوجَّد طريقة اختيارية لحساب ما يفترض أن يكون هذا 
الرقم. ولذلك فقد تم اقتراح عدة طرق إرشادية مختلفة. وفيما يلي نذكر أكثر هذه الطرق شيوعًا: 
- انظر إلى النسبة المئوية للفارق الموضَّح كدالة لعدد المجموعات؛ أيْ: اختر عددًا من المجموعات؛ 
بحيث لا يؤدي إضافة مجموعة أخرى إلى إعطاء نماذج أفضل للبيانات. وعلى وجه التحديده 
إذا تم توضيحٌ السب المئوية للتباين في أحد الرسوم البيانية بواسطة المجموعات؛ فهناك 
نقطة سينخفض عندها الكسب الهامشي (إعطاء زاوية في الرسم البياني)؛ مما يشير إلى عدد 
المجموعات التي سيتمٌ اختيارها. 
- اضبط عددّ المجموعات على V / Y (n7 Y)‏ حيث 2 هو عدد نقاط البيانات. 
- استخدم معيار المعلومات عكلنهك41 (410): وهو مقياسٌ للصلاحية الملائمة (على أساس مفهوم 
34e JA (entropy Los ;3Vl‏ المجموعات. 
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- استخدم معيار المعلومات 88(:651488: وهو معيار اختيار النموذج (على أساس الحَذَّ الأقصى 
لتقدير الاحتمال) لتحديد عدد ال مجموعات. 

طرق التحليل: قد يعتمد تحليل المجموعات على واحد أو أكثر من الطرق العامة التالية: 
- الأساليب الإحصائية Le)‏ في ذلك التسلسل الهرمي وغير الهرمي)» -k-modes 5l k-means :J:s‏ 
- الشبكات العصبية (مع أسلوب بناء يُسمَّى خريطة التنظيم الذاق). 
- المنطق الضبابي (مثل: خوارزمية قصهعم-0 (fuzzy‏ 
- الخوارزميات الجينية. 

تعمل (S‏ طريقة من هذه الطرق بشكلٍ عام مع واحدة من فثتي الطريقة العامة: 
- انقسام: مع الفصول المقسّمةء تبدأ جميع العناصر في مجموعة واحدة وتتفكك. 
- تجميع هرمي: مع الفئات التجمعية» تبدأ جميع العناصر في مجموعات فردية» وتكون 

ا مجموعات مجمعة معًا. 

وتتضمّن معظم طرق التحليل التجميعية استخدام مقياس المسافة؛ لحساب التقارب بين أزواج 
العناصر. وتشمل مقاييس المسافة المنتشرة المسافة التقليدية (أيْ: المسافة العادية بين نقطتين 
يمكن قياسها بالمسطرة) ومسافة مانهاتن (وتُسمّى أيضًا المسافة المستقيمة: أو مسافة التاكسي بين 
نقطتين). وفي كثير من الأحيان تقوم على مسافات حقيقية يتم قياسهاء ولكن هذا لا يلزم أن يكون 
كذلك» كما هو الحال عادةً في تطوير نظم المعلومات. كما يمكن استخدامٌ المتوسطات المرجّحة 
لتحديد هذه المسافات. فمثلا في مشروع تطوير 18 قد تكون الوحدات الفردية للنظام مرتبطة 
بالتشابه بين مدخلاتهاء والمخرجاتء والعمليات, والبيانات المحدّدة الممستخدّمة. ثم يتم تجميع 
هذه العواملء متزاوجةً حسب العنصي في مقياس مسافة واحدة. 

الخوارزمية التجميعية 726925-ك1: يمكن القول بأن خوارزمية 12-6225 (حيث تشير ‏ إلى 
عدد مُحدّد مسبقاً من المجموعات) هو أكثر الخوارزميات التجميعية التي يُشار إليها. كما أن لها 
جذورها في التحليل الإحصائي التقليدي. وكما يوحي الاسم؛ فإن هذه الخوارزمية تقوم بتعيين كل 
نقطة بيانات (العميل: الحدث, الكائن... إلخ) إلى المجموعة التي يكون مركزها (التي يُطلق عليها 
أيضًا النقطة الوسطى) هو الأقرب. ويتم حسابٌ المركز كمتوسط جميع النقاط في المجموعة؛ 
أي إِنَّ إحداثياتها هي المتوسط الحسابي لكل بُعد بشكل منفصل على كل النقاط في المجموعة. 
ويوضّح الشكل 1-6 خطوات هذا الخوارزمية والتي سنذكرها فيما يلي: 
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- خطوة التهيئة: اختر عدد ا مجموعات (أيْ: قيمة >1). 

- الخطوة :١‏ إنشاء نقاط عشوائية ع1 عشوائيًا كمراكز مجموعة أولية. 

- الخطوة ؟: قم بتعيين كل نقطة إلى مركز المجموعة الأقرب. 

- الخطوة 8: إعادة إنشاء مراكز المجموعات الجديدة. 

- خطوة التكرار: کرر الخطوتین ۲ و۴ حتى يتم استيفاء معيار تقارب (عادةً ما يصبح تعيين 
النقاط إلى المجموعات ثابنًا). 

















شكل :١7-6‏ توضيح بياني للخطوات في خوارزمية K-Means‏ 

التنقيب في قاعدة الترابط: 

alos e ub Ul cs nl) dal Bae à cadiz) dad‏ التقارب أو تحليل سلة السوق) 
أسلوبًا شائعًا للتنقيب في البيانات؟ إذ يُستَخدّم عادةً كمثال لتوضيح ما الذي يعنيه التنقيب في 
البيانات» وما يمكن أن يفعله لجمهور أقل خبرة من الناحية التقنية. وقد يكون معظمكم قد سمع 
عن العلاقة الشهيرة (أو سوء السمعة؛ فهذا يعتمد على نظرتكم إليها) التي تفصل بين مبيعات البيرة 
والحفاضات في محلات البقالة. وكما تقول القصة؛ فإن سلسلة متاجر $55 V Le s Walmart Le j)‏ 
حيث لا يُوجّد توافق في الآراء بشأن سلسلة السوق الفائقة التي كانت عليها) قامت بتحليل عادات 
الشراء لدى العملاء. ووجدت علاقة ارتباط ذات دلالة إحصائية بين مشتريات البيرة ومشتريات 
الحفاضات. وقد وُجد أن السبب في ذلك هو أن الآباء (الذين يفترض أنهم شباب) كانوا يتوقفون في 
السوبر ماركت لشراء حفاضات لأطفالهم (خاصةً أيام الخميس». ولأنهم م يعد بإمكانهم النزول إلى 
ساحة الرياضة في كثيرٍ من الأحيانء مثلما لم يعد بإمكانهم شراء البيرة أيضًا. ونتيجةً لذلكء يزعم أن 
سلسلة المتاجر الكبرى وضعت الحفاضات بجانب البيرة؛ مما أدى إلى زيادة مبيعات كليهما. 
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ويهدف استخراج قاعدة المجموعات في جوهره إلى إيجاد علاقات مثيرة للاهتمام (الصلات) 
بين المتغيرات (البنود) في قواعد البيانات الكبيرة. وبسبب تطبيقه الناجح لمشكلات تجارة التجزئة؛ 
فإنه يُطلّق Jda ole ade‏ سلة السوق. وتتمثل الفكرة الرئيسية في تحليل سلة السوق في 
تحديد العلاقات القوية بين المنتجات المختلفة (أو الخدمات) التي يتم شراؤها عادةً مكّا (تظهر في 
نفس السلة معَّاء إما سلة مادية في متجر للبقالة أو سلة افتراضية على موقع للتجارة الإلكترونية). 
فمثلا يشتري >1٥‏ من أولئك الذين يشترون تأميئًا شاملًا للسيارات التأمين الصحي أيضًا. و١‏ 
من أولئك الذين يشترون الكتب عبر الإنترنت يشترون الموسيقى عبر الإنترنت أيضّا؛ بالإضافة إلى 
أن 1٠‏ من أولئك الذين لديهم ارتفاعٌ في ضغط الدم وزيادة الوزن؛ لديهم ارتفاع كوليسترول في 
الدم؛ و70“ من العملاء الذين يشترون حاسباً محمولاً وبرامج الحماية من الفيروسات يشترون 
أيضًا خطط خدمة مُوسّعة. 

وتتمثل المدخلات في تحليل سلة السوق في بيانات معاملات نقطة البيع البسيطة؛ إذ يتم 
تبويب عدد من المنتجات أو الخدمات التي تمَّ شراؤها معًا (تمامًا مثل محتوى إيصال الشراء) في 
حالة معاملة واحدة. وتُّعَد نتيجة التحليل بمثابة معلومات لا تُقدَّر بثمن والتي يمكن استخدامها 
لفهم سلوك الشراء لدى العملاء بشكلٍ أفضل لتحقيق أقصى قدرٍ من الرّبح من المعاملات التجارية؛ 
إذ تستفيد الأعمال التجارية من هذه المعرفة عبر: 
-١‏ وَضع العناصر بعضها بجانب بعض؛ لجعلها أكثر ملاءمةً للعملاء لالتقاطها معا وعدم نسيان 

شراء واحدة عند شراء الأخرى (زيادة حجم المبيعات). 
-١‏ الترويج للبنود كحزمة (لا تضع واحدةٌ للبيع إذا كان الآخرون معروضين للبيع). 
- وضعها بعضها بعيدًا عن بعض؛ بحيث يكون على العميل المشي في الممرات للبحث عنه؛ وذلك 

من خلال القيام بذلك من المحتمل رؤية وشراء سلع أخرى. 

وتشتمل تطبيقات تحليل سلة السوق على التسويق المتقاطع, والبيع المتقاطع» وتصميم 
المتجرء وتصميم الكتالوج» وتصميم موقع التجارة الإلكترونية؛ بالإضافة إلى تحسين الإعلان عبر 
الإنترنت» وتسعير المنتج؛ فضلًا عن تكوين المبيعات/ الترويج؛ إذ يساعدٌ تحليل سلة السوق في 
جوهره الشركات على استنتاج احتياجات العملاء وتفضيلاتهم من أنماط الشراء. وخارج نطاق 
عام الأعمال؛ فإن قواعد المجموعات pisus‏ بنجاح لاكتشاف العلاقات بين الأعراض والأمراض 
والتشخيص وخصائص وعلاجات المريض (التي يمكن استخدامها في نظام دَعْم القرار الطبي) 
والجينات ووظائفها (التي يمكن استخدامها في مشاريع الجينوميات)» من بين jl‏ أخرى. وفيما 
يلي بعض المناطق والاستخدامات الشائعة لاستخراج قاعدة المجموعات: 


۲A1‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات التنبؤية (1): عمليةء وطرقء وخوارزميات التنقيب في البيانات 


- معاملات البيع: يمكن استخدامٌ مجموعات من منتجات التجزئة التي تم شراؤها معًا لتحسين 
موضع المنتج في الطابق المخصّص للمبيعات (وضع المنتجات التي تتماثى بعضها مع بعض) 
والتسعير الترويجي للمنتجات (وليس وجود عروض ترويجية على dS‏ من المنتجات التي يتم 
شراؤها في الغالب (ko‏ 
- معاملات بطاقات الائتمان: توفر العناصر المشتراة من خلال بطاقة ائتمانية بيانات عن منتجات 
أخرى يُرجّح قيامٌ العميل بشرائها أو استخدام أرقام بطاقات الائتمان. 
- الخدمات المصرفية: يمكن استخدام أنماط الخدمات المتسلسلة التي يستخدمها العملاء (فحص الحساب 
متبوعًا بحساب التوفير) لتحديد الخدمات الأخرى التي قد يكونون مهتمين بها (حساب استثماري). 
- منتجات خدمات التأمين: يمكن استخدامٌ حزم منتجات التأمين التي يشتريها العملاء (التأمين 
على السيارات يتبعها التأمين المنزلي) لاقتراح منتجات تأمين إضافية (التأمين على الحياة) أو 
مزيج غير عادي من مطالبات التأمين يمكن أن يكون علامةٌ على الاحتيال. 
- خدمات الاتصالات: تساعد مجموعات الخيارات التي تمّ شراؤها بشكل عام (مثل: انتظار 
المكالمات: وهوية المتصلء والاتصال الثلائي) على تكوين حزم المنتجات بشكل أفضل لزيادة 
الإيرادات. وينطبق الشيء نفسه على مُرْوْدي خدمات الاتصالات المتعددة القنوات من خلال 
الهاتف والتلفزيون وعروض خدمة الإنترنت. 
- السجلات الطبية: يمكن أن تشير توليفات معينة من الحالات إلى زيادة خطر حدوث مضاعفات 
مختلفة؛ أو يمكن ربط بعض إجراءات العلاج في بعض المرافق الطبية بأنواع معينة من العدوى. 
إن أفضل سؤالٍ ينبغي طرحه فيما يخضٌ الأماط/ العلاقات التي يمكن أن تكتشفها قواعد 
مجموعات الاستخراج هو «هل كل قواعد الترابط مثيرة للاهتمام ومفيدة؟» وللإجابة عن سؤال من 
هذا القبيل؛ فإن قواعد ترابط الاستخراج تستخدم مقياسين شائعين: الدعم والاعتدال والرفع. وقبل 
تعريف هذه المصطلحات؛ دعنا نحصل على القليل من التقنية من خلال إظهار شكل قاعدة الارتباط: 
إحاسب محمولء برامج مكافحة الفيروسات] ١‏ إخطة الخدمة الموسعة] .]4۷١ >۳١[‏ 
حيث ترتبط × (المنتجات أو الخدمةء تسمى الجانب الأيسرء 1138ء أو سابقة) ب لآ (المنتجات 
أو الخدمة» وتسمى الجانب الأهنء ۸118 أو مرافقه). و8 هو الدعم» و٤‏ هي الثقة لهذه 
القاعدة الخاصة. فيما ياي الصيغ البسيطة ل Lifts Confs Supp‏ 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري YAY‏ 


الفصل الرابع 
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إن الدَّعم (5) المجموعة من المنتجات هو مقياس مدى تكرار ظهور هذه المنتجات أو الخدمات 
RHS Ja)‏ + 1.115 - الحاسب المحمول وبرامج مكافحة الفيروسات وخطة الخدمة الموسّعة) 
في نفس المعاملة؛ EC]‏ نسبة المعاملات في مجموعة البيانات التي تحتوي على جميع المنتجات أو 
الخدمات المذكورة في قاعدة مُحدّدة. وفي هذا المثال كانت “١٠‏ من جميع المعاملات في قاعدة 
بيانات المتجر الافتراضية تحتوي على جميع المنتجات الثلاثة الموجودة في بطاقة مبيعات واحدة. 
ثقة القاعدة هي مقياس مدى تلازم المنتجات أو الخدمات في 1515 (الناتجة) مع المنتجات أو 
m‏ على نظام xs SL) LHS‏ نسبة المعاملات التي تتضمّن نظام LHS‏ في حين تتضمّن 
Lá Í‏ 8515. وبعبارة أخرى؛ فإن الاحتمال المشروط هو العثور على 11515 للقاعدة الموجودة في 
ا معاملات التي بُوجَّد بها بالفعل نظام 11158 للقاعدة. وقيمة الرفع لقاعدة الارتباط هي نسبة 
ثقة القاعدة والثقة ا متوقعة من القاعدة. eig‏ تعريف الثقة المتوقعة للقاعدة على أنها نتاج قيم 
دعم 1:15 و2115 مقسومًا على دعم نظام 115.آ. 
وتتوفر čás‏ خوارزميات لاكتشاف قواعد hazil‏ إذ تتضمّن بعض الخوارزميات ال معروفة 
همرك واداء8 بالإضافة إلى e5335 .FP-Growth‏ هذه الخوارزميات فقط بنصف امهمةء وهو 
تحديد العناصر المتكررة في قاعدة البيانات. ex [e‏ تحديد العناصر المتكررة؛ فإنها تحتاج إلى 
تحويلها إلى قواعد مع الأجزاء السابقة واللا قة؛ إذ إِنَّ تحديد القواعد من المواد المتداولة هو 
عملية مطابقة p‏ لكن العملية قد تستغرق وقنًا طويلًا مع قواعد بيانات المعاملات الكبيرة. 
وعلى الرغم من أنه يمكن أن يكون هناك العديد من العناصر في كلّ مقطع من القاعدة؛ فإنّ 
الجزء الذي يترتب على Bale. eS‏ ما يحتوي على عنصر واحد. وفي القسم التالي سوف نتناول 
شرح إحدى الخوارزميات الأكثر شيوعًا لتحديد العناصر المتكررة. 


YMA‏ ذكاء الأعمال والتحليلات وعلم البيانات, منظور إداري 


التحليلات التنبؤية (1): عمليةء وطرق» وخوارزميات التنقيب في البيانات 


خوارزمية 13011م4: وهو النظام الأكثر استخدامًا لاكتش اف قواعد الارتباط. وبالنظر إلى 
مجموعة من العناصر (مثل مجموعات من معاملات البيع بالتجزئةء وكل عنصر من العناصر 
الفردية التي تم شراؤها). تحاول هذه الخوارزمية العثور على مجموعاتٍ فرعية شائعة على الأقل 
aus] dol Xa‏ العناصر (أَيْ: إنها تتوافق مع الحد الأدنى من الدعم). ويستخدم 6101م4 Golul‏ 
من القاعدة إلى القمة؛ إذ يتم توسيعٌ مجموعات فرعية متكررة عنصرًا واحدًا في كلّ مرة (وهي 
طريقة تُعرّف باسم جيل المرشح؛ إذ يزدادٌ حجم المجموعات الفرعية المتكررة من مجموعات فرعية 
ذات عنصر واحد إلى مجموعاتٍ فرعية من فئتين» ثم مجموعات فرعية ثلاثية العناصر... الخ)» Qs‏ 
اختبار مجموعاتٍ من المرشحين في كلّ مستوى ضد البيانات؛ للحصول على الحَدّ الأدنى من الدعم. 
وتنتهي الخوارزمية عند عدم العثور على ملحقات إضافية ناجحة. 

وكمثالٍ توضيحي: ضَعْ في اعتبارك ما يلي: يتتبع متجر البقالة عمليات نقل المبيعات بواسطة 
5161 (وحدة حفظ المخزون)»» وبالتالي يعرف العناصر التي يتح شراؤها عادةً معًا. يظهر في 
الشكل ١6-6‏ قاعدة بيانات المعاملات, إلى جانب الخطوات اللاحقة لتحديد العناصر المتكررة. 
وکل رمز 511 في قاعدة بيانات المعاملة يتحول إلى منتج. مثل: «1 = «butter‏ و»2 = «bread‏ 
(JI Las «water 2 3»5‏ ذلك. تتمثل الخطوة الأول i$ Apriori à‏ حساب الترددات (أيْ: 
الدعامات) لكلّ عنصر (عناصر من عنصر واحد). yS Sis hhh JÈL Malo‏ دعنا نعيّن 
الحد الأدفى للدعم إلى * (أو 00 مما يعني أن العنصر يُعَدُ عنصرًا متكررًا إذا تمّ عرضه في 
۴ من أصل ٦‏ معاملات على الأقل في قاعدة البيانات). ونظرًا لأن جميع العناصر المكونة من 
عنصر واحد تحتوي على ۴ على الأقل في عمود الدعم؛ فكلها تُعَذُ عناصم متكررة. ومع ذلك؛ فإنه 
إذا م تكن أي من عناصر المجموعة الواحدة متكررة؛ فلن يتم إدراجها كعضو محتمل في زوجين 
من النقاط محتملين. وبهذه الطريقة: يُحرّر 11013م4 شجرة جميع العناصر الممكنة. وكما يوضح 
الشكل 6-؟!؛ فإنه باستخدام عناصر مجموعة واحدة: يتم إنشاء جميع عناصر العناصر المكنة, 
ويتم استخدام قاعدة بيانات المعاملة لحساب قيم الدعم الخاصة بها. ونظرًا لأن عنصر العناصر 
المكون من عنصرين ]0 1 يحتوي على دَعْم أقل من "؛ فلا يجب تضمينه في العناصر المتكررة 
التي سيتمٌ استخدامها لإنشاء مجموعات العناصر التالية (عناصر من العناصر الثلاثة). وتبدو 
هذه الخوارزمية بسيطةً بشكلٍ خادع؛ ولكن فقط لمجموعات البيانات الصغيرة. أما في مجموعات 
البيانات الأكير بكثير - خاصة تلك التي تحتوي على كميات هائلة من العناصر الموجودة بكميات 
منخفضة وكميات صغيرة من العناصر اللوجودة في كميات كبيرة - فإن البحث والحساب يصبح 
عملية مكثفة من حيث الحساب. 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري PAS‏ 


الفصل الرابع 
































مجموعات بلود ثلاثية البند ٠‏ مجموعات بنود Naas‏ مجموعات بنود أحادية البند بيانات العملية الخام 

مجموعة البند sus Mey‏ رقم 

(Skus) Gkus | e?‏ ركم البند العملية 
3 124 3 1 | | 1.2.3.4 | 1001234 
3 23.4[ | 6 2 | 2.3.4 | 1001235 
|l. 5 4 |‏ 2.3 1001236 
La 5 |‏ 1.2.4 | 1001237 





1001238 1,2,3,4 
1001239 2,4 



































شكل 16-6: تحديد مجموعات البنود المتكررة في خوارزمية Apriori‏ 


أسئلة مراجعة على القسم 0-6: 

-١‏ حَدّد على الأقل ثلاث طرق من الطرق الرئيسة للتنقيب في البيانات. 

۲- اذكر أمثلة عن مواقف يمكن أن يكون فيها التصنيف أسلوباً مناسباً للتنقيب في البيانات. 
واذكر أمثلة على الحالات التي يكون فيها الانحدارٌ أسلوبًا مناسبًا للتنقيب في البيانات. 

۴- اذكر على الأقل اثنين من تقنيات التصنيف مع تعريفٍ موجز لهما. 

-٤‏ ما هي بعض المعايير لمقارنة واختيار أفضل تقنية للتصنيف؟ 

0- صف باختصار الخوارزمية العامة المستخدمة في أشجار القرار. 

1- عرّف مؤشر جيني. واذكر ماذا يقيس؟ 

-١/‏ ما هو نموذج المجموعة في مجال التنقيب في البيانات؟ ما هي مزايا وعيوب نماذج المجموعة؟ 

4- اذكر أمثلةً للمواقف التي سيكون فيها التحليلٌ التجميعي تقنيةً مناسبةً لاستخراج البيانات. 

٩‏ ما هو الفرق الرئيس بين التحليل التجميعي والتصنيف؟ 

-٠١‏ اذكر بعض طرق التحليل التجميعي؟ 

-١‏ اذكر al‏ على الحالات التي يكون فيها الارتباط تقنية مناسبة للتنقيب في البيانات. 


1-٤‏ أدوات برمجيات التنقيب في البيانات: 


يوفر العديدٌ من مورّدي البرامج أدواتٍ قويةً للتنقيب في البيانات. من أمثلة هؤلاء الموردين: 
BM SPSS Modeler) MBI áS, FE‏ وامعروفة سابقًا (Clementine 9 SPSS PASW Modeler gwl‏ 


۳۹۰ ذكاء الأعمال والتحليلات وعلم البيانات. منظور إداري 


التحليلات التنبؤية (1): عمليةء وطرقء وخوارزميات التنقيب في البيانات 


- شركة 545 (رائدة ال مشروعات). 
- شر ,45 Statistica) Dell‏ والمعروفة سابقًا .(StatSoft Statistica Data Miner gwl‏ 
- شر XKXEN Infinite Insight e. ÓL. c35,sLls Infinite Insight) PAS às;‏ 
- أنظمة (CART, MARS, TreeNet, RandomForest) 5)54JL.‏ 
-Angoss (KnowledgeSTUDIO, KnowledgeSEeker) 4$ 5 -‏ 
-Megaputer (PolyAnalyst) 4$ 5 -‏ 

بشكل ملحوظ ولكن ليس من المستغرب, يتم تطوير أدوات التنقيب في البيانات الأكثر شيوعًا 
واستخدامًا من قبل شركات البرمجيات الإحصائية الراسخة إلى حد كبير (مثل 56005016 ,5555 ,5435)؛ 
لأن الإحصاءات هي أساس التنقيب في البيانات» وهذه الشركات لديها وسائل فعالة من حيث 
التكلفة تقوم بتطويرها في أنظمة الإستخراج الشامل للبيانات. كما أن معظم مُورّدي أدوات ذكاء 
-Tableaus SAP Business Objects; Oracle Hyperions IBM Cognos :J£4) JU. eSI‏ 
"Teradatas .MicroStrategys .Qliks «Tibcos‏ و81205016) لديهم أيضًا مستوى معين من 
قدرات التنقيب في البيانات المُدمَجة في عروض البرامج الخاصة بهم. ولا تزال أدوات ذكاء الأعمال 
هذه تركّر في المقام الأول على النمذجة المتعددة الأبعاد وتصوير البيانات» ولا 35 iba‏ مباشرة 
مورّدي أدوات التنقيب في البيانات. 

إضافة إلى هذه الأدوات التجارية؛ تتوفر العديدٌُ من أدوات برمجيات جمع البيانات املفتوحة 
المصدر أو المجانية على الإنترنت. وبشكلٍ بديهي - ولا سيما في الإدارات التربوية - تُعَنُ ill Weka‏ 
التنقيب في البيانات المجانية والمفتوحة الأكثر انتشارًا. والتي تمّ تطويرها من قبل عدد من الباحثين 
من جامعة à Waikato‏ نيوزيلندا (يمكن تنزيل الأداة (cs. waikato.ac.nz/ml/weka (y...‏ .$5293( 
68 على عدد كبير من الخوارزميات لمهامٌ مختلفة للتنقيب في البيانات ولديها واجهة 
مُستخدم سهلة الاستخدام. وقد ظهر في الآونة الأخيرة عددٌ من الأدوات المجانية ا مفتوحة 
المصدر وذات قدرة عالية على التنقيب في البيانات: يقود المجموعة KNIME (knime.org)‏ 
.RapidMiner (quickminer.com)s‏ فلديهما واجهات مُستخدم بيانية مُحسّنة» وأيضًا بهما 
عد كبيرٌ من الخوارزميات» ومجموعة متنوعة من مَيْزات التمثيل البصري للبيانات» كل تلك 
الخصائص تيزهما عن بقية الأدوات المجانية. ويُعَدٌ هذان البرنامجان المجانيان أيضًا برنامجين 
أساسيين xs‏ 954 تشغيلهما على نظامي à x2 l gag (Macs Windows Jè ès‏ 
lal a 8,22 d 5 eL 23b RapidMiner cal «455,5‏ التحليلات الخاصة بهم مجانًا 
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(أيّْ: نسخة مجتمعية)؛ وذلك في أثناء تصنيع المنت ج التجاري الكامل. لذلك؛ فبمجرد إدراج 
RapidMiner‏ 32.5 فنئة الأدوات المجانية/ مفتوحة المصدرء غالبًا ما يتم إدراجها في قائمة الأدوات 
التجارية. iz‏ الاختلاف الرئيس بين Js‏ من الأدوات التجارية )مڎJ: SAS Enterprise Miner‏ 
«RapidMinerg -Weka :J i) 4 lel cilssVls (Statisticas JBM SPSS Modeler g‏ 
و85 ) هو الكفاءة الحسابية. وقد تستغرق مهمة التنقيب ف البيانات نفسها التي تنضمن 
مجموعة بيانات كبيرة وغنية بالميزات وقتاً أطول بكثير لتكتمل مع أدوات الرمجيات ا مجانية 
وبالنسبة لبعض الخوارزميات» قد لا تكتمل المهمة (أيْ: تتعطل بسبب الاستخدام غير الفعّال 
لذاكرة الحاسب). يعرض الجدول 6-؟ بعضًا من ال منتجات الرئيسة والمواقع الخاصة بها. 

هناك مجموعةٌ من قدرات ذكاء الأعمال والتحليلات التي أصبحت أكثر شيوعًا بشكلٍ متزايد 
لدراسات التنقيب في البيانات» وهي 5۲۷۴۲ 5Q1‏ 0۴۲٥إءM1‏ (فقد تم تضمينها لإمكانات 
تحليلات أكثر بشكل متزايدء مثل ذكاء الأعمال ووحدات النمذجة التنبؤية؛ وذلك بدءًا من إصدار 
ez 31 (SQL Server 2012‏ عمل مستودعات البيانات والنماذج في نفس بيئة قاعدة البيانات 
العلائقية؛ مما يجعل إدارة النماذج daga‏ أسهل بكثير. يعمل تحالف Microsoft Enterprise‏ 
كمصدر عالمي للوصول إلى مجموعة برامج :5696 .501 :211020508 للأغراض الأكادهية, 
كالتدريس والأبحاث. وقد تمَّ إنشاءٌ هذا التحالف؛ لتمكين الجامعات في جميع أنحاء العام 
من الوصول إلى تقنية المؤسمات دون الحاجة إلى صيانة الأجهزة والبرامج الضرورية في مبانيها 
الخاصة. كما يوفر التحالف مجموعةً واسعةً من أدوات تطوير ذكاء الأعمال (كالتنقيب في 
البيانات» بناء المكعبات» إعداد تقارير الأعمال) إضافةً إلى عدد من مجموعات البيانات الكبيرة 
والواقعية مj Microsoft Enterprise Alos A . Tyson Foodsg Dillard's Sams Club‏ 
مجانيًا ولا يمكن استخدامه إلا للأغراض الأكاديمية. تستضيف كلية 1873105 .2/1 JlssSU Sam‏ 
بجامعة 41132535 النظام المؤسسي وتس مح لأعضاء التحالف وطلابه بالوصول إلى هذه الموارد 
باستخدام اتصالٍ بسيط عن بعد بسطح المكتب. ويمكن معرفة تفاصيل الانضمام لهذا التحالف 
وكذلك الدروس سهلة المتابعة وبعض الأمثلة في -walton.uark.edu /enterprise‏ 
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التحليلات التنبؤية (1): pbg dlos‏ وخوارزميات التنقيب في البيانات 


جدول 6-": برامج مختارة للتنقيب في البيانات 














(URL) اسم المنتج الموقع‎ 
www-0l.ibm.com/software/analytics/spss/products/ 
IBM SPSS Modeler 
modeler/ 
ibm.com/analytics/watson-analytics/ IBM Watson Analytics 
sas.com/en id/software/analytics/enterprise-miner.html | SAS Enterprise Miner 





statsoft.com/products/statistica/product-index 


Dell Statistica 





megaputer.com/site/polyanalyst.php 


salford-systems.com 


PolyAnalyst 


CART, RandomForest 





solutionmetrics.com.au/products/iminer/default.html 
solver.com/xlminer-data-mining 


help.sap.com/ii 


Insightful Miner 
XLMiner 


SAP InfiniteInsight (KXEN) 





fqs.pl/ghostminer 
msdn.microsoft.com/en-us/library/bb510516.aspx 


knowledgeminer.com 





GhostMiner 
SQL Server Data Mining 


Knowledge Miner 





teradata.com/products-and-services/Teradata- 


warehouse-miner/ 


Teradata Warehouse Miner 





oracle.com/technetwork/database/options/odm/ 


Oracle Data Mining (ODM) 





fico.com/en/analytics/decision- management-suite/ 


FICO Decision Management 





orange.biolab.si/ 


Orange Data Mining Tool 





zementis.com 





Zementis Predictive Analytics 
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في مايو ١15‏ ام أجرت ela: 1.1 KDnuggets.com‏ البرامج السنوي الثالث عشر بشأن السؤال 

التالي: «ما هي البرامج التي استخدمتها في التحليلات» والتنقيب في البيانات» وعلم البيانات» ومشاريع 

es‏ الآلة خلال ال ؟١‏ شهرًا الماضية؟». وقد حظي الاستطلاع بمشاركة رائعة من مجتمع التحليلات 

وعلم البيانات والمورّدين؛ مما جذب ١885‏ ناخبًا اختاروا عددًا قياسيًا بلغ ؟١٠‏ من الأدوات المختلفة. 

وقد أثمر هذا الاستطلاع عن بعض النتائج المثيرة للاهتمام منها: 

- لا تزال ۸ هي الأداة الرئيسة» بحصة تبلغ 6٩‏ من الأسهم (بعد أن كانت 67,5 في عام ١٠١۲م)»‏ 
ولکن استخدام ١10ر‏ ازداد بسرعة واكتسب ما يقرب من ۸ بحصة ٤٥,۸‏ من الأسهم 
(والتي توقفت عند ۳۰,۳ في ۲۰۱۵م). 

- لا RapidMiner Ul‏ هي المنصة العامة الأكثر انتشارًا بشأن التنقيب في البيانات/ علم البيانات» 
بنسبة بلغت 7#“ من الأسهم. ومن الأدوات البارزة التي تحظى بأكبر قدر من النمو في الانتشار 
هي scikit- 9 «Amazon Machine Learnings «H209 MLlibg .Dataikus «Dato‏ 
.IBM Watsons dearn‏ 

- ينعكس الخيار المتزايد للأدوات في الاستخدام الأوسع؛ إذ بلغ متوسط عدد الأدوات المستخدمة 
۰ (مقابل 8,؟ في مايو 16١م).‏ 

- ارتفع استخدام أدوات مه11200/ البيانات الكبيرة إلى 49 بعد أن كان ۲۹× في عام ١٠۲۰م‏ 
ولاالا في عام 6١١٠م (ASI eda) Spark 44:54) MLlibs Apache Spark (3 (ys le534‏ 
و8120. والتي أدرجناها ضمن أدوات البيانات الكبيرة. 

- كانت المشاركة حسب المنطقة؛ وذلك كالتالي: الولايات المتحدة / كندا )*6٠(‏ أوروبا (799) آسيا 
)00,6( أمريكا اللاتينية (0,۸)» أفريقيا / الشرق الأوسط (37,5), أستراليا / نيوزيلندا (ا,؟). 

- في هذا العام, استخدم 87“ من المصوتين برامج تجاريةء في حين استخدم ۷0< البرامج المجانية. 
واستخدم حوالي <۲١‏ فقط البرامج التجاريةء و١١‏ فقط استخدموا البرامج المفتوحة المصدر / 
ا مجانية. واستخدم الأغلبية مقدار >٦١‏ كلا من البرامج ا مجانية والتجارية على حَدّ سواء في 
حين كانت 1٤‏ في عام ۲۰۱۰م. 

- بالنسبة للسنة الثأنيةء شمل استطلاع KDnuggets.com‏ أدوات ele‏ العميق. ففي هذا 
العا استخدم 18“ من المصوتين أدوات التعلم العميق» أيّ: ضعف نسبة عام ١٠١۲م‏ والتي 
كانت 5 وبهذا 533 354 I Google Tensorflow z‏ المركز الأول» متخطيًا النظام البيئي 
2 صاحب الصدارة في العام الماضي. 
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التحليلات التنبؤية (1): عمليةء وطرقء وخوارزميات التنقيب في البيانات 


- في مجتمع لغات البرمجة. ارتفعت شعبية SScalas Unixs Javas Python os Js‏ في حين 


.Lispg «Clojureg F #3 Juliag Perl «C/C++ من‎ js انخفضت شعبية‎ 


وللحَدٌ من التحيّز à‏ التصويت المتعدّد؛ قام موقع KDnuggets.com‏ ضف هذا الاستطلاع 
بالتحقق من البريد الإلكتروني؛ وذلك بهدف جَعْل النتائج أكثر تمثي لا للواقع في عالم التحليلات. 
ويُظهر في الشكل 10-6 نتائج لأفضل 20 من الأدوات البرمجية (وذلك وفقًا لإجمالي عدد الأصوات 
المستلمة). كما يقوم الرسم البياني الأفقي أيضًا بالتمييز بين الأدوات المجانية/ مفتوحة المصدر 


yao 


والتجارية وبيانات م112000 / البيانات الضخمة باستخدام مخطط الترميز ذي الألوان. 





Cice 
[4399 ul أدوات مجانية أخرى للتحليلات اللتتغيب‎ 
برمجة وبياات أخري‎ IA 
H20 
Scala 
SAS Enterprise Miner 
Microsoft Power. Bi 
Hbase 
OlkView. 
Microsol Anmwe Machno 


Lessing 
HDPSiHadoop (e i3 y jid أدواث‎ 


Saford SPMICART/RFIMARS/TreeNel 
Grm Ociave 























Source: used with permission from KDnuggets 
شكل 10-6: الأدوات البرمجية الشائعة للتنقيب في البيانات‎ 
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حالة عملية 5-6 
التنقيب في البيانات ينتقل إلى هوليوود: توقع النجاح المالي للأفلام 

تتعلّق الحالة العملية 6-” بدراسة بحثية؛ إذ يتخ استخدام عددٍ من الأدوات البرمجية 
وتقنيات جمع البيانات لبناء تماذج التنقيب في البيانات؛ للتنبؤ بالنجاح المالي (إيرادات 
شباك التذاكر) لأفلام هوليوود في حين أنها ليست أكثر من مجرد أفكار. 

يُعَذّ توقع إيرادات شباك التذاكر (أَيْ: النجاح المالي) لصورة متحركة معينة؛ مشكلةٌ 
$a ia‏ للاهتمام ومليئةٌ بالتحديات. ووفقاً لبعض خبراء المجال؛ فإن صناعة السينما 
i55‏ «أرض العقبات واممخاطر الجامحة»؛ بسبب الصعوبة ال مرتبطة بالتنبؤ بالطلب 
على المنتج؛ مما يجعل أعمال السينما في هوليوود محفوفةً بالمخاطر. ودعمًا لمثل 
هذه الملاحظات. يقول 779181 ع2[ (الرئيس والمدير التنفيذي السابق لاتحاد الصور 
المتحركة الأمريكية): «لا أحد يستطيع أن يخبرك كيف سينتج الفيلم في السوق. ليس 
قبل أن يفتح الفيلم في مسرح مظلم» والشرر يطير بين الشاشة والجمهور». وقد 
كانت الصحف والمجلات التجارية الخاصة بصناعة الترفيه مليئةٌ بالأمثلة والتصريحات 
والخبرات التي تدعم مثل تلك المطالب. 

وكما هو الحال بالنسبة للعديد من الباحثين الذين حاولوا إلقاء الضوء على هذه المشكلة 
المليئة بالتحَدّيات في العام الحقيقي» كان Dursun Deleng «Ramesh Sharda ja ds‏ 
يستكشفان استخدام التنقيب في البيانات؛ للتنبؤ بالأداء مالي للصورة المتحركة في شباك 
التذاكر قبل أن يدخل الإنتاج (في حين أن الفيلم ليس أكثر من فكرة مفاهيمية). وفي نماذج 
التنبؤ ذات الانتشار الكبير. يتم تحويل مشكلة التنبؤ (أو الانحدار) إلى مشكلة تصنيف؟ 
بمعنى أنه بدلا من التنبؤ بتقدير نقطة لإيرادات شباك التذاكر؛ يتم تصنيف ds oló Gİ‏ 
لإيراداته ووضعه في إحدى الفئات التسع. والتي تتراوح من الهبوط الشديد «م10» إلى 
الإقبال «6]ناط»ك010»؛ مما يجعل المشكلة مشكلة تصنيف متعددة الحدود. Tiss‏ 
الجدول ١-6‏ تعريف الفئات التسع من حيث نطاق إيصالات شباك التذاكر. 





TABLE 4.3 Movie Classification Based on Receipts 
Cass No. ١ 2 3 4 $£ é 7 8 9 
Range >t >l >l >Ð > > <0 >0 m 


(in miions «610 «X «64 <66 «6K0 «6I «6X0 
don) (fy) (Bodiuser) 
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التحليلات التنبؤية (1): عملية. وطرقء وخوارزميات التنقيب في البيانات 


البيانات: 

تمّ جمع البيانات من مجموعة متنوعة من قواعد البيانات المتعلقة بالأفلام (مثل: 
e 239 (L5 4&5 .BoxofficeMojos .AllMovies IMSDbs IMDbs .Showbiz‏ 
دمجها جميعًا في مجموعة بيانات واحدة؛ إذ تحتوي مجموعة البيانات الخاصة بأكثر 
النماذج تطورًا في الآونة الأخيرة على 711" فيلماً تمّ إصدارها بين عامي 1998 Y Ta‏ 
ويعرض الجدول 6-6 ملخصاً للمتغيرات المستقلة إلى جانب مواصفاتها. ولمزيدٍ من 
التفاصيل الوصفية ومبرّرات تضمين هذه المتغيرات المستقلة؛ يتم الاطلاع على كلّ من 
.Delen (2006) s Sharda‏ 


جدول :٤-٤١‏ ملخص للمتغيرات Ala)‏ 
































المتغير المستقل القيم الممكنة 
تصنيف الاتحاد الآ التحركة 
] مريكي للصور اممتحر G, PG, PG-13, R, NR‏ 

MPAA 

امنافسة مرتفع» متوسط منخفض 

قيمة النجم Y‏ مرتفع» متوسط منخفض 
خيال علميء دراما ملحمية تاريخية: دراما 

النوع الأدبي ٠‏ إحديثة. سياسة. إثارة. رعبء كوميدياء كرتون» 
os‏ وثائقي 

مؤثرات خاصة Y‏ مرتفع» متوسط منخفض 

متمم Y‏ نعم لا 

عدد الشاشات 1 عدد صحيح موجب بين ١‏ و٣۳۸۷‏ 

المنهجية: 


باستخدام مجموعة متنوعة من أساليب التنقيب في البيانات» بما في ذلك الشبكات 
العصبية وأشجار القرار وآلة المتجهات الداعمة وثلاثة أنواع من ا مجموعات؛ قام کل من 
Sharda‏ وDelen‏ بتطوي ر نمماذج التنبق. وقد تم استخدامٌ بيانات الحقبة الزمنية من 
۸ إلى ۵١١۲م‏ كبيانات تدريبية لبناء تماذج التنبؤء في حين استخدمت بيانات عام 
n‏ م كبيانات اختبار لتقييم ومقارنة دقة التنبؤات في النماذج. ويعرض الشكل ٠١-٤‏ 
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لقطة شاشة SPSS Modeler jn‏ 182/1 (أداة التنقيب في البيانات (UL. Clementine‏ 
التي تصوّر خريطة العملية المستخدمة لمشكلة التنبؤ؛ إذ يعرض الجانب الأيسر العلوي 
للخريطة عملية تطوير النموذج ويعرض الركن السغني الأمن من الخريطة عملية 
تقييم النموذج (أيْ: الاختبار أو التسجيل). وممزيد من التفاصيل حول أداة 182/5855 
Modeler‏ وكذلك استخدامها فَيُرْجَى الرجوع إلى موقع الكتاب على شبكة الإنترنت). 








NM 
A 


p 








شكل 15-6: لقطة لتدفق عملية نظام التنبؤ بشباك التذاكر 
النتائج: 
يقدّم الجدول 0-6 نتائج التنبؤ لجميع طرق الجمع الثلاث للبيانات بالإضافة إلى 
نتائج المجموعات الثلاث المختلفة. يُعَد أول قياس للأداء هو معدل التصنيف الصحيح 
للنسبة المئوية. ويُطلّق عليه «مع8هذط». وكما ورد في الجدول معدل التصنيف الصحيح 
وهس 1-4 (أيْ: ضمن فثئة واحدة). تشير النتائج التي يعرضها الجدول إلى أن /51/2 كان 
أفضل نماذج التنبق الفردية, Ci g> $ ANN geb‏ خوارزمية شجرة قرار CART‏ $ 
المركز الأخير كأسوا تموذج. بشكلٍ عام؛ حققت نماذج المجموعة أداءً أفضل من نماذج 
التنبؤ الفرديةء التي أَدّتَ خوارزمية الاند ماج فيها أفضل أداءٍ ممكن. ids‏ الانحراف 
ا معياري المنخفض للغاية الذي تم الحصول عليه من ا مجموعات هو - على الأرجح - 
أكثر أهمية لصانعي القرار وقراءة جدول النتائج. مقارنة بالتماذج الفردية. 
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التحليلات التنبؤية (1): عمليةء وطرقء وخوارزميات التنقيب في البيانات 


yaa 


جدول 0-6: نتائج التنبؤ المجدولة للنماذج الفردية والجماعية 









































نماذج التنبق 
النماذج الجماعية 
7 الغابة الشجرة | الاندماج 
مقياس الأداء | t mx | 7 [CART SVM‏ 
العشوائية |المدعومة | (متوسط) 
ME TY 1۸۹ | 16 yaY (bingo) asl‏ 
Ww. ME wi | 1 yee | (1-Away) axll‏ 
الدقة Xow.V | X0t£,-.0 | ZW,o£ | X&£«,£3 | Z'1s,0Y | Z£3,00 | (Zbingo)‏ 
الدقة Z4. Vo | Zyn At | ZA, | ZAA,VT | ZYAAV. | X6,00. | (C1L-Away)‏ 
الانحراف المعياري NW “AE Sn 10 A‏ 
الاستنتاج: 


يذّعي الباحثون أنَّ نتائج التنبؤ هذه أفضل من أيّ تقارير منشورة فيما يتعلق 
بنطاق هذه المشكلة. وبالإضافة إلى الدقة الجذابة لنتائج التنبؤق بإيرادات الشباك؛ 
فإنه يمكن استخدام هذه النماذج كذلك لتحليل متغيرات القرار (وربما تحسينها) 
لتعظيم العائد المالي. وعلى وجه التحديد؛ يمكن تغبير المعلمات المُستَخدّمة 
للنمذجة باستخدام نماذج التنبؤ المجرّبة بالفعل للوصول إلى فهم أفضل لتأثير 
المعلمات المختلفة على النتائج النهائية. وخلال هذه العملية» والتي تُسمّى Bale‏ 
«تحليل الحساسية»؛ يمكن لصانع القرار في إحدى الشركات الترفيهية أن يكتشف» 
بمستوى دقة عالٍ إلى حَدٌَ ماه مقدار قيمة النجاح المالي التي يمكن أن يحققها ممثل 
معين (أو تاريخ صدور محدد. أو إضافة المزيد التأثيرات الفنية... إلخ)؛ مما يجعل 
النظام الأساسي أداةً لا تُقدَّر بثمن لدعم القرار. 


أسئلة للمناقشة: 


-١‏ مماذا يعتبر التنبو بالنجاح ال الي للأفلام أمرّا مهما بالنسبة للعديد من صناع 
السينما في هوليوود؟ 
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؟- كيف يمكن استخدام التنقيب في البيانات للتنبؤ بالنجاح المالي للأفلام قبل بدء 
عملية الإنتاج؟ 

"- كيف تعتقد أن هوليوود نجحت في هذه المهمة إلى الآن دون مساعدة من 
أدوات وتقنيات التنقيب في البيانات؟ 


Sources: Sharda, R., & Delen, D. (2006). Predicting box-office success of motion 
pictures with neural networks. Expert Systems with Applications, 30, 243254-; 
Delen, D., Sharda, R., & Kumar, P. (2007). Movie forecast Guru: A Web-based DSS 
for Hollywood managers. Decision Support Systems, 43(4), 11511170-. 


أسئلة مراجعة على القسم 5-6: 

-١‏ ما هي أدوات التنقيب في البيانات التجارية الأكثر انتشارًا؟ 

AST o aiz U -Y‏ الأدوات انتشارًا يت تطويرها من قبل الشركات القائمة على الإحصاء؟ 

*- ما هي أكثر أدوات التنقيب في البيانات المجانية انتشارًا؟ ولماذا تتمتع بهذا الانتشار الهائل (خاصة S(R‏ 

-٤‏ ما هي الاختلافات الرئيسة بين أدوات البرمجيات التجارية وأدوات التنقيب في البيانات المجانية؟ 

ما هي معايير الاختيار الخمسة الأولى لأداة التنقيب في البيانات؟ اشرح إجابتك. 

۷-٤‏ مشكلات خصوصية التنقيب في البيانات» والخرافات» والأخطاء الفادحة: 
غالبًا ما تحتوي البيانات التي يتم جمعها وتخزينها وتحليلها في مجال التنقيب في البيانات على 

معلومات حول الأشخاص الحقيقيين. وقد تتضمن هذه المعلومات ما يلي: 

-١‏ بيانات التعريف (الاسم» والعنوان» ورقم الضمان الاجتماعي» ورقم رخصة القيادة. ورقم 
الموظفء وما إلى ذلك). 

؟- البيانات الدهوغرافية (مثل: العمرء والجنسء والعرقء والحالة الاجتماعيةء وعدد الأطفال). 

- البيانات المالية (مثل: الراتب» أو دخل الأسرة الإجمالي» أو التحقق من رصيد الحساب أو التوفيره 
أو ملكية المنزل» أو تفاصيل حساب الرهن العقاري أو القرضء أو حدود بطاقات الائتمان 
والأرصدة, أو تفاصيل حساب الاستثمار). 

-٤‏ تاريخ الصفقات الميرّمة (أيْ: ما يتم شراؤه من أين ومتى» سواء من سجلات المعاملات الخاصة 
بالبائع أو من المعاملات الخاصة ببطاقة الائتمان). 

ه- البيانات الشخصية (مثل: ذكرى الزواج السنوية. الحملء المرضء الوفيات في العائلة» إيداعات الإفلاس). 
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ويمكن الوصول إلى معظم هذه البيانات من خلال بعض مقدَّمي البيانات التابعين لجهات 
خارجية. والسؤال الرئيس هنا هو عن خصوصية الشخص الذي تنتمي إليه البيانات. وللحفاظ 
على خصوصية وحماية حقوق الأفراد؛ يجب أن يتمتع متخصصو التنقيب في البيانات بسمات 
أخلاقية فضلًا عن الالتزامات القانونية. وتتمثل إحدى طرق تحقيق ذلك في عملية إلغاء تحديد 
سجلات العملاء قبل تطبيق تطبيقات التنقيب في البيانات؛ بحيث لا يمكن تتبّع السجلات للفرد. 
وقد تمَّ بالفعل إلغاء تحديد العديد من مصادر البيانات المتاحة للجمهور (مثل: بيانات CDC‏ 
بيانات 51:58:16 Lig (UNOS Gbk‏ الوصول إلى مصادر البيانات هذه. يُطلب من المستخدمين 
في كثير من الأحيان الموافقة على أنهم - تحت أيّ ظرف من الظروف - سيحاولون تحديد هوية 
الأفراد الذين يقفون وراء هذه الأرقام. 

كان هناك عددٌ من الحالات في الماضي القريب؛ إذ شاركت بعض الشركات بيانات العملاء 
مع الآخرين دون الحصول على موافقة صريحة من عملائها. فعلى سبيل المثال - كما قد يتذكر 
معظمكم - في عام ١٠٠٠م,‏ قدّمت شركة 5©هنلينة 6]83106[ السجلات الخاصة بأكثر من مليون 
مسافر من عملائها لشركة Torch Concepts‏ وهي مقاولة حكومية أمريكية. ثم قامت Torch‏ 
بعد ذلك بتعزيز بيانات الركاب بمعلومات إضافية» مثل: أحجام العائلة وأرقام الضمان الاجتماعي» 
وهي معلومات تم شراؤها من وسيط بيانات يُسمّى 461051. وكان القصد من قاعدة البيانات 
الشخصية الموحّدة أن تُستَخدّم في مشروع التنقيب في البيانات؛ بغرض التنبؤ بملامح الإرهاب 
المحتمل. وقد تمَّ كل هذا دون إخطار أو موافقة الركاب. وعندما خرجت أخبار تلك الأنشطة؛ 
تم تقديمٌ العشرات من قضايا الخصوصية ضد -Acxioms Torch 5 JetBlue‏ ودعا العدید من 
أعضاء مجلس الشيوخ الأمريكي إلى إجراء تحقيق في الحادث (2004 ,10814). وخرجت في الماضي 
القريب أخبارٌ مماثلةً متعلقة بالخصوصية عن شركات الشبكات الاجتماعية الشهيرة والتي أشيع 
أنها كانت تبيع بيانات خاصة بالعملاء إلى شركات أخرى للتسويق المستهدف الشخصي. 

كانت هناك قصةٌ غريبةٌ أخرى عن مخاوف الخصوصية التي وصلت إلى عناوين الأخبار في عام 
٠۲‏ م. في هذه الحالةء م تستخدم الشركة حتى أي بيانات خاصة و/ أو شخصية. من الناحية 
القانونية: لم يكن هناك انتها لأية قوانين. وتلخص الحالة العملية ۷-٤‏ تلك القضية - وا متعلقة 
بشركة 1٠۲8٠٤‏ - بشيء من التفصيل. 
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حالة عملية ۷-٤‏ 
توقع أنماط شراء العملاء - قصة Target‏ 

تدور القصة حول فتاة مراهقة كانت تشارك منشورات إعلانية وكوبونات من قبل 
SL elg Target‏ التي تشتريها السيدة الحامل للمرة الأولى من متجر "Target Jia‏ 
تقول القصة: ذهب رجل غاضب إلى شركة Us .Minneapolis c-;L 2 Target‏ 
بالتحدث إلى أحد المديرين؛ فقال: «استلمت ابنتي هذا منكم عن طريق البريد. إنها 
لا تزال في المدرسة الثانوية وترسلون لها كوبونات ملابس الأطفال وأسرّة الأطفال حديثي 
YI‏ هل تحاولون تشجيعها على الحمل؟». لم يكن لدى المدير أي فكرة عمًا يتحدث 
عنه الرجل. نظر في المرسّل؛ فوجد أنها كانت موجّهة إلى ابنة الرجل وتضمّنت إعلانات 
عن ملابس الأمومة وأثاث الحضانة وصور الرضع. اعتذر المدير ثم اتصل بعد بضعة ell‏ 
على الهاتف للاعتذار مرةً أخرى. ومع ذلك؛ بدا الأب متضايقاً إلى حدٌ ما عندما رد على 
المدير قائلًا: «لقد تحدثت مع ابنتي وتبَيّن بي أن هناك بعضّ الأنشطة في منزلي م أكن على 
دراية بها. إنها في انتظار مولودها الأول بالفعل وأنا مدينٌ لك باعتذار». ولكن السؤال 
هنا كيف عرفت Target‏ أن الفتاة كانت حاملًا قبل اكتشاف والدها للحقيقة؟ وفيما 
يلي الإجابة عن هذا السؤال: إن شركة :1,86 تُخصّص لكلّ عميل رقم بطاقة تعريف 
كضيف لديها (مرتبطة ببطاقة الائتمان» أو الاسم أو عنوان البريد الإلكتروني) الذي يصبح 
عنصرًا نائبًا يحتفظ بسجلٍ لكل ما اشتراه. وتقوم 11۲86۲ بتعزي ز هذه البيانات بأيّ 
معلومات دهوغرافية قاموا بجمعها من العملاء أنفسهم. أو تم شراؤها من مصادر 
معلومات أخرى. وباستخدام هذه المعلومات؛ نظرت شركة مدآ" في بيانات الشراء 
السابقة لجميع الإناث اللواق قمن بتسجيل أسمائهن في سجلات أمهات الأطفال المنتظر 
استقبالهم. وقاموا بتحليل البيانات من جميع الاتجاهات. وسرعان ما ظهرت بعض 
الأماط المفيدة. فعلى سبيل COS JÈL‏ مستحضرات اللوشن والفيتامينات الخاصة 
من بين المنتجات ذات أنماط الشراء المثيرة للانتباه. فالكثيرٌ من الناس يشترون اللوشنء 
ولكن ما لاحظوه هو أن السجلات التي تحتوي على بيانات سيدات ينتظرن أطفال 
يقمن بشراء كميات أكبر من محلول اللوشن غير المعطر مع بداية الثلث الثاني من فترة 
الحمل. ولاحظ محلل آخر أنه في وقت ما في الأمابيع العشرين الأولى من فترة الحمل, 
تقوم النساء الحوامل بالاعتماد على المكملات مثل: الكالسيوم والمغنيسيوم والزنك. كما 
يقوم العديدٌ من المتسوقين بشراء صابون وكرات قطنية» ولكن عندما تبدأ سيدة ما فجأة 
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بشراء الكثير من الصابون الخالي من الرائحة وأكياس كبيرة من كرات القطنء بالإضافة إلى 
مطهرات اليد ومناديل الحمام؛ فإن ذلك يشير إلى قرب موعد استقبالها لمولودها. وفي 
النهاية؛ تمكّنوا من تحديد Lóns YO dha>‏ عندما تم تحليلها مكّاء مكنتهم من تحديد 
درجة توقع وجود حمل من عدمه لكل متسوق. والأهم من ذلك؛ استطاعت Target‏ 
Loo‏ تقدير تاريخ الولادة لكلّ سيدة t Jal‏ لذلك يتم إرسال كوبونات منتجات معينة 
بتواريخ مُحدّدة لكلّ متسوقة بحسب المرحلة التي تمر بها في حملها. 





إذا نظرت إلى هذه الممارسة من منظور قانوني؛ فستستنتج أن 181861 م تستخدم 
أيّ معلومات تنتهك خصوصية العميل؛ إنهم فقط استخدموا بيانات المعاملات التي 
تقوم S‏ سلسلة تجارة التجزئة الأخرى تقريبًا بجمعها وتخزينها (وربهما تحليلها) حول 
عملائها. ولكن ما كان مزعجًا في هذا السيناريو رها كان المفهوم المستهدف: الحمل. 
فهناك بعض الأحداث أو المفاهيم يجب أن تكون غير قابلة للتداول أو أن يتم التعامل 
معها بحذر شديد مثل: أمراض الشيخوخةء والطلاق. والإفلاس. 


أسئلة للمناقشة: 





-١‏ ما رأيك في التنقيب في البيانات وتأثيرها على الخصوصية؟ وما هي العتبة 
الفاصلة بين اكتشاف المعرفة وانتهاك الخصوصية؟ 

Target olhs Ja -Y‏ هل فعلت أيّ شيء غير قانوني؟ برأيك. ما الذي كان يجب أن 
تفعله ؛مع181؟ وهل يجب على 15866 الإقلاع عن هذه الأنواع من الممارسات مستقبلا؟ 
Sources: Hill, K. (2012, February 16). How Target figured out a teen girl was pregnant‏ 


before her father did. Forbes; Nolan, R. (2012, February 21). Behind the cover story: 


How much does Target know? NYTimes.com. 

خرافات وأخطاء فادحة حول التنقيب في البيانات: 
adl X sd‏ في البيانات أداةً albos‏ قوية تمن المديرين التنفيذيين من التقدِّم في وصف 
طبيعة الماضي (بالنظر إلى مرآة الرؤية الخلفية) للتنبؤ بالمستقبل (النظر إلى الأمام) لإدارة عملياتهم 
التجارية بشكل أفضل (اتخاذ قرارات دقيقة وفي الوقت المناسب). تساعد عملية التنقيب في 
البيانات جهات التسويق في العثور على أنماط تفصح عن أسرار تتعلّق بسلوك العملاء. تمكن 
استخدام نتائج التنقيب في البيانات لزيادة الإيرادات وخفض التكلفة من خلال تحديد الاحتيال 
واكتشاف الفرص التجارية؛ مما يوفر مناخًا جديدًا تمامًا وجيدًا للمَيْزة التنافسية. وكحقل متطور 
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وناضج» يرتبط التنقيب في البيانات غالبًا بعدد من الخرافات» والتي يعرض الجدول 5-6 بعضًا منها 


-(Delen, 2014; Zaima, 2003) 


جدول 1-6: خرافات التنقيب في البيانات 





الواقع 


الخرافة 





A35‏ عملية التنقيب في البيانات عمليةٌ متعددة الخطوات 
تتطلب تصميمًا واستخدامًا متعمدًا واستباقيًا. 


يوفر التنقيب في البيانات تنبؤات تشبه كرة 
بلورية فورية. 





الحالة الحالية للتنقيب في البيانات جاهزةٌ للاستعمال 
تقرييبًا لأيّ نوع أو حجم عمل. 


التنقيب في البيانات غير قابل للتطبيق مع 
تطبيقات الأعمال السائدة. 
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يسبب التقدّم في تقنية قاعدة البيانات؛ لا يلزم وجود 
قاعدة Olily‏ مخصصة. 

تمكن الأدوات الحديثة القائمة على الويب المديرين من جميع 
المستويات التعليمية من القيام بعملية التنقيب في البيانات. 


يتطلب التنقيبٌُ في البيانات قاعدة بيانات 
يمكن فقط للأشخاص ذوي الدرجات العلمية 
المتقدّمة القيام بالتنقيب في البيانات. 





إذا كانت البيانات تعكس بدقة الأعمال أو عملائهاء هكن 


التنقيب في البيانات هو فقط للشركات 


لأيَّ شركة استخدام التنقيب في البيانات. 











الكبيرة التي لديها الكثير من بيانات العملاء. 





لقد اكتسب مناصرو التنقيب في البيانات فائدةً تنافسيةً هائلةً من خلال فهم أنّْ هذه الخرافات 
هي مجرد: خرافات. وعلى الرغم من أن قيمة الاقتراح وبالتالي ضرورة وجودها واضحة لأيّ شخص؛ 
فإن أولئك الذين ينفذون مشاريع التنقيب في البيانات سواءً المبتدئ أو عاط البيانات المتمرس 
يرتكبون أخطاءً أحيانًا تؤدي إلى مشاريع ذات نتائج أقل من المرغوب فيها. ونعرض فيما يلي ١7‏ 
من الأخطاء الشائعة في التنقيب في البيانات» ويجب أن يكون علماء البيانات على دراية بها. «Ades‏ 
یتحتم علیهم بذل قصاری جهدهم لتجنبها :ط5× وآخرون 2001 ,kھ1ھ)؟‏ ;2004 Shut,‏ 2009: 
١‏ اختيار مشكلة خطا للتنقيب في البيانات: فلا هكن حل كلّ مشكلة تجارية بالتنقيب في 
البيانات (أيّ: متلازمة الطلقة السحرية). وعندما لا توجد بيانات تمثيلية (كبيرة وغنية 
بالميزات)» فلا يمكن أن يكون هناك مشروع استخراج بيانات عملي. 
Jolas -Y‏ مايعتقده الداعمون في ما يمكن فعله وما لا يمكن فعله باستخدام التنقيب في البيانات: 
فإدارة التوقعات هي مفتاح نجاح مشاريع التنقيب في البيانات. 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات التنبؤية (1): عمليةء وطرقء وخوارزميات التنقيب في البيانات 


"'- البدء دون وَضْع تصؤر للنهاية: على الرغم من أن التنقيب في البيانات هو عملية اكتشاف 
للمعرفة؛ فإنه يجب أن يكون لدى المستخدم هدفٌ (مشكلة أعمال محددة) في ذهنه للنجاح. 
لأنه. وكما يقول المثل: «إذا كنت لا تعرف إلى أين أنت ذاهب؛ فلن تصل إلى هناك أبدَّا». 

-٤‏ تحديد ا مشروع الذي لا تدعمه بياناتك: يُعَد التنقيب في البيانات هو كل شيء عن البيانات؛ بمعنى 
أن القيد الأكبر لديك في مشروع التنقيب في البيانات هو ثراءٌ البيانات. فمعرفة حدود البيانات 
تساعدك على صياغة مشاريع قابلة للتطبيق وتحقق النتائج ا مرجوة منها وتفي بالتوقعات. 

-٥‏ تحديد وقتِ غير كاف لإعداد البيانات: إذ يتطلّب التجهيرٌ مجه ودا أكبر من اممتوقع غالبًا. 
حيث تشير المعرفة الشائعة إلى أن ما يصل إلى ثلث إجمالي وقت ال مشروع يتم استهلاكه على 
مهام جمع البيانات» وفهمهاء وتجهيزها. ولتحقيق النجاح؛ تجِنَّب البدء في النمذجة قبل أن 
تتم معالجة بياناتك بشكل صحيح (بحيث تكون متكاملة ومُنظّفة ومُحَوّلة). 

-١‏ النظر فقط في النتائج المجمّعة وليس في السجلات الفردية: يكون التنقيب في البيانات في 

أفضل حالاته عندما يتم تمثيل البيانات بشكل دقيق. oiz dalo‏ تجميع البيانات وتبسيطها 

بشكل لا داعي له لمساعدة خوارزميات التنقيب في البيانات؛ فهي لا تحتاج إلى مساعدتك 

١ فلديها قدرة فائقة على فعل كل ذلك بنفسها.‎ si> 

الوقوع في فم تتبّع إجراءات ونتائج التنقيب: ولأنها عمليةٌ اكتشاف تنطوي على العديد من 

التكرارات والتجارب؛ فمن المرجّح أن تفقد مسار النتائج. يتطلب النجاح تخطيطًا ممنهجًا 

ومنظمًا وتنفيذًا وتتبُعًا / تسجيلًا لجميع مهام التنقيب في البيانات. 

8- استخدام بيانات مستقبلية للتنبؤ بالمستقبل: بسبب عدم وجود وصف وفهم للبيانات» في كثير 
من الأحيان يقوم مُحلّلو البيانات بتضمين متغيرات غير معروفة في الوقت الذي من امفترض 
أن يتم التنبؤ فيه. ومن خلال القيام بذلك؟ تنتج نماذج التنبؤ الخاصة بها نتائج دقيقة لا يمكن 
تصديقها (وهي ظاهرة يُطلق عليها غالبًا «ذهب الأغبياء»). وإذا كانت نتائج التنبؤ الخاصة 
بك جيدة جدًا لدرجة يصعب تصديقها؛ فإنها عادةً ما تكون كذلك؛ وفي هذه الحالةء فإن أول 
شيء تحتاج للبحث عنه هو الاستخدام غير الصحيح متغير من المستقبل. 

-٩‏ تجاهل النتائج اطمشبوهة وانتقل بعيدًا عنها بسرعة: غالبا ما تكون النتائج غير المتوقعة هي 
مؤشرات المستجدات الحقيقية في مشاريع التنقيب في البيانات. ويمكن أن يؤدي التحقيق 
السليم في مثل هذه النتائج الشاذة إلى اكتشافات مثيرة للدهشة. 

-٠‏ البدء بمشروع مجمع رفيع المستوى من شأنه أن يجعلك نجمًا فوق العادةٌ: غالبًا 

ما تفشل مشاريع التنقيب في البيانات إذا مم يتم التفكير فيها بعناية من البداية إلى النهاية. 


1 
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الفصل الرابع 


piin gll Jb La Ll‏ منتظم ومنظم للمشاريع من الصغيرة / البسيطة إلى 
الكبيرة / المعقدة. ويجب أن يكون الهدف هو إظهار القيمة المضافة التدريجية والمستمرة. 
بدلا من الدخول في مشروع كبير يستهلك الموارد دون إنتاج أيّ نتائج ذات قيمة. 


-١‏ تشغيل خوارزميات التنقيب في البيانات بشكل متكرّر وأعمى: على الرغم من أن أدوات 


التنقيب في البيانات اليوم قادرةٌ على استهلاك البيانات وإعداد معلمات خوارزمية لتحقيق 
نتائج؛ فإنه ينبغي لمستخدم البيانات معرفة كيفية تحويل البيانات وتعيين قيم المعلمات 
المناسبة للحصول على أفضل النتائج الممكنة. فلكلٌ خوارزمية طريقةٌ فريدةٌ خاصةٌ بها معالجة 
البيانات» ومعرفة ما هو ضروري للحصول على أقصى استفادة من كل نوع من أنواع النماذج. 


- تجاهل خبراء الموضوع: يتطلّب فهم نطاق المشكلة والبيانات ذات الصّلة تعاونًا شديدًا 


بين التنقيب في البيانات وخبراء المجال. فالعمل الجماعي يساعد خبير التنقيب في البيانات 
على تجاوز التمثيل النحوي والحصول أيضًا على الطبيعة الدلالية (أيْ: المعنى الحقيقي 
للمتغيرات) للبيانات. 


- تصديق كل ما قيل لك عن البيانات: على الرغم من ضرورة التحدّث إلى خبراء المجال لفهم 


البيانات ومشكلة العمل بشكل أفضل؛ فَإنَّ عالم البيانات يجب ألا يأخذ أيّ شيء على أنه 
أمر مُسلَمٌ به. إن الفاعلية والتحقق من خلال التحليل النقدي هما مفتاح الفهم الحميم 
للبيانات ومعالجتها. 

افتراض أن حُماة البيانات سيتواجدون بشكلٍ كاملٍ للتعاون في أي وقت يُطلَّب منهم ذلك: 
تفشل العديدٌ من مشاريع التنقيب في البيانات؛ لأن خبير التنقيب في البيانات لا يعرف/ 
لا يفهم السياسات التنظيمية. قد يكون أحد أكبر العقبات في مشاريع التنقيب في البيانات هم 
الأشخاص الذين يملكون البيانات ويسيطرون عليها. إن فهم وإدارة السياسة هو مفتاح تحديد 
البيانات والوصول إليهاء وفهمها بشكلٍ صحيح لإنتاج مشروع ناجح للتنقيب في البيانات. 
اختلاف معيار قياس النتائج بين المحلل وصاحب البيانات: يجب أن توجّه النتائج إلى 
المستخدم النهائي (المدير / صانع القرار) الذي سيس تخدمها. وبالتالي؛ فإن تقديم النتائج 
في مقياس وشكل يجذب المستخدم النهاني يزيد بشكل كبير من احتمالية الفهم الحقيقي 
والاستخدام السليم لنتائج التنقيب في البيانات. 

إذا قمت ببنائه؛ فسيأق: لا تقلق بشأن كيفية ale aga‏ يعتقد خبراء التنقيب في 
البيانات أنها تتم بمجرد إنشاء نماذج جيدة تلبّي وتزيد على احتياجات / متطلبات / توقعات 
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التحليلات التنبؤية (1): عمليةء وطرقء وخوارزميات التنقيب في البيانات 


المستخدم النهائي (أيْ: العميل). وبدون انتشار جيد؛ تكون القيمة المحدّدة لنتائج التنقيب 
في البيانات محدودةً نوعًا ما. لذلك؛ ÅS‏ الاتتشار خطوةًٌ أخيرةٌ ضروريةً في عملية التنقيب 
في البيانات؛ إذ يتم دَمْج النماذج في البنية التحتية لدعم القرار التنظيمي؛ من أجل تمكين 
عملية اتخاذ القرار بشكلٍ أفضل وأسرع. 


أسئلة مراجعة على القسم 6-ل: 

-١‏ ما هي مشكلات الخصوصية في التنقيب في البيانات؟ 

؟- كيف تعتقد أن يتحسّن النقاش بين الخصوصية والتنقيب في البيانات؟ وماذا؟ 

*- ما هي أكثر الخرافات شيوعًا حول التنقيب في البيانات؟ 

©- ما رأيك في أسباب هذه الخرافات حول التنقيب في البيانات؟ 

-٥‏ ما هي الأخطاء الأكثر شيوعًا في التنقيب في البيانات؟ وكيف يكن تخفيفها أو القضاء عليها تمامًا؟ 


تلخيص لأهمٌ نقاط الفصل: 

Cuacll is) -‏ البيانات عمليةً لاكتشاف المعرفة الجديدة من قواعد البيانات. 

- يكن أن يستخدم التنقيب في البيانات ملفات مسطحة بسيطة كمصادر بيانات أو يمكن تنفيذها 
على بيانات في مستودعات البيانات. 

- هناك العديدُ من الأسماء والتعريفات البديلة للتنقيب في البيانات. 

- يتواجد التنقيب في البيانات في تقاطع العديد من التخصصات. بما في ذلك الإحصاء والذكاء 
الاصطناعي والنمذجة الرياضية. 

- تستخدم الشركات التنقيب في البيانات؛ لفهم عملائها بشكل أفضل وتحسين عملياتها. 

- يمكن العثور على تطبيقات التنقيب في البيانات في كلّ مجال من مجالات الأعمال والحكومة: بما 
في ذلك الرعاية الصحية وامالية والتسويق والأمن الداخلي. 

JS 5x3 -‏ من التنبؤ (التصنيف أو الانحدار)» والتجميع والترابط ثلاث فئاتِ واسعة من مهام 
التنقيب في البيانات. 

- مثل مبادرات التعزيز المؤسسي الأخرى؛ يجب أن يتبع مشروع استخراج البيانات عملية منهجية 
لإدارة المشاريع لتكون ناجحة. 
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الفصل الرابع 


- اقتراحُ العديد من عمليات SEMMA s .CRISP-DM :5blJE à cud!‏ و1221 وما إلى ذلك. 

يوفّر 018158-024 طريقةً منتظمةً ومنظمةً لإجراء مشاريع التنقيب في البيانات. 

- تستهلك الخطوات السابقة في مشاريع التنقيب في البيانات (أَيْ: فهم المجال والبيانات ذات 
(iLa‏ معظم الوقت الإجمالي للمشروع (غالبًا ما يزيد عن <۸٠‏ من الوقت الإجمالي). 

- تعد المعالجة الأوّلية للبيانات أمرًا ضروريًا لأيّ دراسة ناجحة للتنقيب في البيانات؛ إذ تؤدي 
البيانات الجيدة إلى معلومات جيدة. وا معلومات الجيدة تؤدي إلقزارات جيدة: i‏ 

- تنضمّن معالجة البيانات الأؤلية أربع خطوات رئيسة: دَمْج البيانات» وتنظيف البيانات» وتحويل 
البيانات» وتقليل حجم البيانات. 

- تتعلّم مناهج التصنيف من الأمثلة السابقة التي تحتوي على مدخلات وعلامات الفئات الناتجة 
وبمجرد أن يتم تدريبهم بشكلٍ صحيح؛ يكونون قادرين على تصنيف الحالات المستقبلية. 

- يتم تجميعٌ سجلات نمط الأقسام إلى شرائح أو مجموعات طبيعية؛ بحيث يتشابه clàs‏ كل 

شريحة في خصائص معينة. 

e»‏ استخدام عدد من الخوارزميات المختلفة بشكلٍ شائع بغرض التصنيف. وتشمل التطبيقات 

.SPRINT5 .CHAIDs CART «C55 .C4.55 4D3 à; jlacil 

تقوم أشجار القرار بتقسيم البيانات عن طريق التفرّع عبر سمات مختلفة؛ بحيث يكون لكلّ 

مجموعة أوراق نمط فئوي مشترك. 

يُعَذ مؤشر 121 والحصول على المعلومات (الانتروبيا)؛ طريقتين شائعتين لتحديد خيارات التفرّع 

في شجرة القرار. 

- يقيس مؤشْرٌ ذهز© نقاء العينة. فإذا كان كل شيء في عينة ينتمي إلى فئة واحدة, تكون قيمة 
مؤشر خمذت صفر. 

- تستطيع عدة تقنيات تقييم أن تقيس دقة التنبؤ لنماذج التصنيف» ها في ذلك التقسيم البسيط 
التحقق المتقاطع ع8صامم 60052 .1-1010 والمساحة تحت منحنى ROC‏ 

- يتم استخدام خوارزميات التجميع عندما لا تحتوي سجلات البيانات على معرّفات فئة معرفة 

مسبقًا (معنى؛ لا يعرف إلى الفئة التي ينتمي إليها سجل معين). 

تحسب خوارزميات التجميع مقاييس التشابه؛ من أجل تجميع حالات مماثلة في مجموعات. 

dad -‏ قياس المسافة هو مقياس التشابه الأكثر استخدامًا في التحليل التجميعي. 

- يُعَدُ كلّ من 1-6205 والخرائط ذاتية التنظيم؛ هما أكثر خوارزميات التجميع شيوعًا. 
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التحليلات التنبؤية (1): عمليةء وطرق» وخوارزميات التنقيب في البيانات 


- يُستخدّم التنقيب في قواعد الارتباط؛ لاكتشاف اثنين أو أكثر من العناصر (أو الأحداث 
أو المفاهيم) التي تذهب معاً. 


- يُشار عادةً إلى التنقيب في قواعد الارتباط بمصطلح تحليل سلة السوق. 


Òl -‏ خوارزمية الارتباط الأکٹر استخدامًا ھی ۲1هام A؛‏ إذ en‏ تحديد العناصر المتكرّرة من خلال 


اتباع نهج تصاعديّ (من أسفل إلى أعلى). 
- يتم تقييم قواعد الارتباط بناء على مقاييس ls itl eol‏ بها. 


- تتوفر العديد من أدوات التنقيب في البيانات سواء كانت مجانية أو بمقابل مادي. 
- إن أدوات التنقيب في البيانات التجارية الأكثر شعبية هي 52557285117 و:1 1/110 „SAS Enterprise‏ 


- إن أشهر أدوات التنقيب في البيانات المجانية هي Weka‏ وRapidMiner.‏ 


























مصطلحات أساسية: 
Aprori iade‏ | شجرة القرار m UE a‏ 
pies B‏ قياس المسافة مصعد RapidMiner‏ 
ROC‏ 
ارتباط طاقم تحليل الارتباط انحدار 
Bootstrapping‏ إنتروبيا SEMMA Microsoft Enterprise‏ 
بيانات تسلسلية مؤشر Gini‏ التحالف تسلسل التنقيب 
تصنيف كسب اللمعلومات خادم مايكروسوفت .501 التقسيم البسيط 
تجمع بيانات فاصلة بيانات اسمية الدعم 
الثقة التحقق ب س / جزء بيانات رقمية Weka‏ 
KNIME CRISP-DM‏ بيانات ترتيبية التنقيب في البيانات 
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الفصل الرابع 


أسئلة للمناقشة: 

-١‏ عرف التنقيب في البيانات. لماذا هناك العديدٌ من الأسماء والتعريفات للتنقيب في البيانات؟ 

؟- ما هي الأسباب الرئيسة وراء الرّواجٍ الحديث للتنقيب في البيانات؟ 

*- ناقش ما يجب على المنظمة مراعاته قبل اتخاذ قرارٍ بشراء برنامج التنقيب في البيانات. 

؟- قارن بين التنقيب في البيانات والأدوات والتقنيات التحليلية الأخرى. 

-٥‏ ناقش طرق التنقيب في البيانات الرئيسة. وما هي الاختلافات الأساسية فيما بينها؟ 

-١‏ ما هي مجالات التطبيق الرئيسة للتنقيب في البيانات؟ ناقش القواسم المشتركة لهذه المجالات 
التي تجعلها فرصةً لدراسات التنقيب في البيانات. 

۷ اذا نحتاج إلى عملية مُوحّدة للتنقيب في البيانات؟ وما هي عمليات التنقيب في البيانات الأكثر شيوعًا؟ 

8- ناقش الاختلافات بين عمليتَيْ التنقيب في البيانات الأكثر استخدامًا. 

9- هل تُعَدَّ عمليات التنقيب في البيانات مجرد مجموعة متسلسلة من الأنشطة؟ اشرح إجابتك. 

-٠١‏ لماذا نحتاج إلى المعالجة المسبقة للبيانات؟ وما هي المهامٌ الرئيسة والتقنيات ذات الصلة 
المُستَخدّمة في المعالجة المسبقة للبيانات؟ 

-١١‏ ناقش الأسباب الكامنة وراء تقييم نماذج التصنيف. 

-١١‏ ما هو الفرق الرئيس بين التصنيف والتجميع؟ اشرح إجابتك باستخدام أمثلة من الواقع. 

-١‏ بالانتقال إلى ما بعد مناقشة هذا الفصلء أين يمكن استخدام الارتباط؟ 

ME‏ ما هي مشكلات الخصوصية في التنقيب في البيانات؟ هل تعتقد أنها موثقة؟ 

la -10‏ هي الخرافات المتداولة والأخطاء الأكثر شيوعًا حول التنقيب في البيانات؟ 


تمارين: شبكة جامعة تيراداتا (10۸) وغيرها من التمارين اليدوية: 
-١‏ قم بزيارة X Aeradatauniversitynetwork.com‏ دراسات الحالة والأوراق البيضاء حول التنقيب 
في البيانات. وقم بوصف التطورات الحديثة في مجال التنقيب في البيانات والنمذجة التنبؤية. 


.teradatauniversitynetwork.com [d] Jäs -Y‏ 237 موقع ندوات الويب المتعلقة بالتنقيب 
في البيانات. C. Imhoff a JS L.4a35 , il» dil g3oa 239 yogadi ag de‏ 
و7005 :1. شاهد ندوة الويب. ثم أجب عن الأسئلة التالية: 
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-١‏ اذكر بعض تطبيقات التنقيب ق البيانات المثيرة للاهتمام؟ 

-Y‏ ما هي أنواع ا لمكاسب والتكاليف التي هكن أن تتوقعها المنظمات من مبادرات التنقيب في البيانات؟ 

۴- بالنسبة لهذا التمرين» يتمثل هدفك في بناء ف وذج لتحديد المدخلات أو المتنبئات التي تميّز 
العملاء المحفوفين بالمخاطر من الآخرين (بناءً على الأنماط المتعلقة بالعملاء السابقين) ثم 
استخدام هذه المدخلات للتنبق بعملاء جدد محفوفين بالمخاطر. تُعَنَّ هذه العينة نموذجيةٌ 
لهذا المجال. وبيانات النموذج المراد استخدامه في هذا التمرين Online W4.1 càls  (,2‏ 
في ملف 0:601]1151]:15. تتضمّن مجموعة البيانات 410 حالة و10 متغيرًا متعلقًا بالعملاء 
السابقين والحاليين الذين اقترضوا من أحد البنوك لأسباب مختلفة. كما تحتوي على معلومات 
متعلقة بالعميل مثل الوضع الماليه وسبب القرضء والتوظيفء والمعلومات الدهوغرافية, 
والنتيجة أو ا متغ رر التابع للمركز الائتماني مع تصنيف كل حالة على أنها جيدة أو سيئة 
بناءً على تجربة المؤسسة السابقة. خُذْ 600 من الحالات كحالات تدريب وقم بتخصيص 
0 حالة أخرى للاختبار. قم ببناء نموذج شجرة قرارات لمعرفة خصائص المشكلة. اختبر أداء 
هذا النموذج على ١0‏ حالة أخرى. ثم قم بإعداد تقريرينء» أحدهما عن أداء التعلم والاختبار 
في نموذجك. والآخر لتحديد نموذج شجرة القرار ومعلمات التدريب بالإضافة إلى الأداء 
الناتج في مجموعة الاختبار. يمكنك استخدام أيّ برنامج لشجرة القرارات. (عككمعءه ونط 
is courtesyof StatSoft, Inc., based on a German data set from ftp.ics.uc;i.edu/‏ 
a jaxlH Ms C83 8 / pub/machine-learning-databases‏ إلى تعريفك بتعدين القاعدة. 
-(statlog/german renamed CreditRisk and altered‏ 

- بالنسبة لهذا التمرين» ستقوم بتكرار de)‏ نطاق أصغر) نمذجة شبك التذاكر الموضّح في 
الحالة العملية 1-6. قم بتنزيل مجموعة بيانات التدريب من كل من «Online File W4.2‏ 
.M i٥50۴ Excel (31:5 (25 «MovieTrain.xlsxs‏ استخدم وصف البیانات امموضح à‏ 
الحالة العملية 7-6 لفهم المجال والمشكلة التي تحاول حلها. قم بانتقاء واختيار المتغيرات 
المستقلة الخاصة بك. قم بتطوير ثلاثة نماذج تصنيف على الأقل (على سبيل ال مثال» شجرة 
القرارات؛ الانحدار اللوجستيء الشبكات العصبية). قارن نتائج الدقة باستخدام تقنيات 
0055-10 10-1014 والتقسيم المئوي واستخدم كذلك مصفوفات الدقة ثم علق 
على النتيجة. اختبر النماذج التي قمت بتطويرها على مجموعة الاختبار (انظر ملف الإنترنت 
:165].:5 210916 ,1874.3). قم بتحليل النتائج بنماذج مختلفة. مع وضع أفضل نموذج 
تصنيفء ودعمه مع نتائجك. 
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5- يهدف هذا التمرين إلى تقديمهك إلى التنقيب في قواعد الارتباط. تحتوي مجموعة بيانات 
e Excel baskets1ntrans.xlsx‏ ۲۸۰۰ ملاحظة / سجل لبيانات منتحجات السوبر ماركت. 
يحتوي كل سجل على بطاقات تعريف للعملاء وامنتجات التي قاموا بشرائها. استخدم 
مجموعة البيانات هذه لفهم العلاقات بين المنتجات (أيْ: المنتجات التي يتم شراؤها lta‏ 
ابحث عن العلاقات المثيرة وأضف لقطات شاشة Ul SS‏ ارتباط خفية قد تجدها. وبشكلٍ 
أكثر تحديدًاء أجب عن الأسئلة التالية: i‏ 
-١‏ ما هي قواعد الارتباط التي تعتقد أنها الأكثر أهمية؟ 

-١‏ استنادًا إلى بعض قواعد الارتباط التي وجدتهاء قم بإجراء ثلاث توصيات أعمال على الأقل 
قد تكون مفيدة للشركة. قد تتضمّن هذه التوصيات أفكارًا حول تنظيم الرّف أو بيع 
المنتجات. (سيتمٌ eda‏ نقاط مكافأة للأفكار الجديدة / المبتكرة). 

۴- ما هي قيم الذّعم والثقة والرفع للقاعدة التالية؟ 

Wine, Canned Veg — Frozen Meal 
sKNIME (knime.org) jJuall في هذه المهمةء ستستخدم أداة تعدين البيانات ا مجانية / مفتوحة‎ -1 
وذلك لإنشاء نماذج تنبؤية لمجموعة بيانات تحليل حركات العملاء الصغيرة نسبيًا. يجب‎ 
عليك تحليل مجموعة البيانات المعطاة (حول سلوك استبقاء / تسرب العميل لعينة مكونة‎ 
عميل) بغرض تطوير ومقارنة ما لا يقل عن ثلاثة نماذج للتنبؤ (أيْ: للتصنيف).‎ ٠٠٠١ من‎ 
فعلى سبيل المثال: يمكنك تضمين مقارنتك على أشجار القرار والشبكات العصبية وآلة المتجهات‎ 
الداعمة والجار الأقرب و / أو نماذج الانحدار اللوجستي. فيما يلي تفاصيل هذه المهمة:‎ 
.(knime.org) ja KNIME ڇaliرڊ تثبيت واستخدام أداة‎ - 
يمكنك أيضًا استخدام 1:81 215 لتجهيز البيانات مسبقًا (حسب حاجتك / رغبتك).‎ - 
موقع الكتاب على الويب.‎ 4 CustomerChurnData.csv قم بتنزيل ملف البيانات‎ - 
(قيم مفصولة بفواصل). وهذا التدنسيق هو تنسيق‎ ٨8۷ يتم إعطاء البيانات بتنسيق‎ - 
الملفات المس طّحة الأكثر شيوعًا والذي يمكن للعديد من أدوات البرنامج فتحه / التعامل‎ 
(MS Excelg KNIME &U5 à Ue) معه بسهولة‎ 

- اعرض نتائجك في مستند احترافي منظم جيدًا. 

- اعرض على صفحة الغلاف معلومات مناسبة عنك وعن المهمة. 
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- تأمّد من تكامل الأرقام (المخططات البيانية, الرسوم البيانية» الجداولء لقطات الشاشة) 
بشكلٍ رائع في الوَضْف النَّصي بطريقة احترافية. كما يجب أن يحتوي التقرير على ستة 
أقسام CRISP-DM Jl; 4423) à)‏ 

- حاول ألا تتجاوز ١١‏ صفحة في الإجماليء بمافي ذلك الغلاف (استخدم الخط 
Times New Roman‏ حجم ۲ وتباعد الأسطر .)۱,١‏ 


مهامٌ الفريق ومشروعات لعب الأدوار: 

-١‏ قم بفحص كيفية قيام أجهزة التقاط البيانات الجديدة, مثل علامات ۸۴1۲ مساعدة 
المؤسسات على تحديد عملائها بدقة وتقسيمهم إلى أنشطة: مثل التسويق المستهدّف. تنطوي 
العديدٌُ من هذه التطبيقات على التنقيب في البيانات. قم بإدخال المطبوعات والويب إلى 
الشاشة باستخدام ا ماسح الضوني (۴۲”١هءء)ء‏ ثم قم باقتراح خمسة تطبيقات محتملة جديدة 
للتنقيب في البيانات يمكنها استخدام البيانات التي تم إنشاؤها باستخدام تقنية ۸۴1۲. 
ما هي القضايا التي يمكن أن تنشأ إذا كانت قوانين البلد تتطلب تضمين هذه الأجهزة في جسم 
كل شخص لنظام تحديد الهوية الوطني؟ 

-Y‏ قم بمقابلة المسؤولين في كليتك أو المسؤولين التنفيذيين في مؤسستك؛ لتحديد كيف يمكن أن 
يساعدهم التنقيب في البيانات ومستودعات البيانات وأدوات 0145 وأدوات التصوير في 
عملهم. اكتب اقتراحًا يَصف نتائجك. ثم قم بإعداد تقرير يتضمّن تقديرات التكلفة والفوائد. 

- يتوفر مستودع جيد جدًا للبيانات التي تم استخدامها لاختبار elof‏ العديد من خوارزميات 
vole ssa gas; Bag .ics.uci.edu/mlearn/MLRepository.html (3 o6t.JI $ cuii‏ 
البيانات إلى اختبار حدود الخوارزميات الحديثة لتعلّم الآلة, وكذلك تهدف إلى مقارنة أدائها 
مع الأساليب الجديدة للتعلم. ومع ذلك؛ قد تكون بعض مجموعات البيانات الأصغر مفيدةٌ في 
استكشاف وظائف أي برنامج من برامج التنقیب ف البیانات« مٹJ Rapid Miner‏ و .KNIME‏ 
قم بتنزيل مجموعة بيانات واحدة على الأقل من هذا المستودع (ولتكنء قواعد بيانات فحص 
الائتمان أو قاعدة بيانات الإسكان) وتطبيق أساليب شجرة القرار أو طرق التجميع حسب 
الاقتضاء. قم بإعداد تقرير بناءً على نتائجك. (يمكن استخدام بعض هذه التمارين» خاصةً تلك 
التي تنطوي على بيانات كبيرة أو مشكلات صعبة كمشاريع على المدى الطويل). 

-٤‏ يتم توفير مجموعات بيانات كبيرة وغنية بالميّززات من قبل الحكومة الأمريكية أو الشركات 
التابعة لها على الإنترنت. فعلى سبيل المشال: يمكنك الاطلاع على مجموعة كبيرة من 
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مجموعات البيانات الحكومية (data.gov)‏ ومجموعات بيانات مراكز السيطرة على الأمراض 
والوقاية منها (ءناءز)ov/DataStع.www.cdc)‏ والمراقبة.ء ومجموعة البيانات الخاصة بعلم 
الأوبئة «Cancer.org (http://seer.cancer.gov/data) à 5,2, 4oleJl 4 .5l4Jl eótzJls‏ 
ومجموعات بيانات نظام تقارير تحليلات معدل الوفيات التابع لوزارة www.nhtsa.) JJ‏ 
5 الاحظ أيضًَا أنه لا يتم عمل معالجة مُسبّقة لهذه ا مجموعات من البيانات 
لأغراض التنقيب في البيانات؛ مما يجعلها موردً! رائعًا لتجربة عملية التنقيب في البيانات 
بالكامل. يتم إدراج مصدر آخر غني لمجموعة من مجموعات بيانات التحليلات على موقع 
-KDnuggets.com (kdnuggets.com/datasets/index.html)‏ 


-٥‏ خذ بعين الاعتبار مجموعة البيانات التالية» والتي تتضمّن ثلاث سمات وتصنيقًا لقرارات 


القبول في برنامج ماجستير إدارة الأعمال: 

-١‏ باستخدام البيانات المعروضة في الجدول أدناه؛ قم بتطوير قواعد الخبرة اليدوية الخاصة 
بك لاتخاذ القرار. 

-١‏ استخدم مؤشر 6121 لإنشاء شجرة قرار. يمكنك استخدام الحسابات اليدوية أو جدول 
البيانات أدناه لإجراء الحسابات الأساسية. 


'- استخدام برنامج شجرة قرارات آلي لإنشاء شجرة لنفس البيانات. 
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تمارين الإنترنت: 


Jai; Joe äl .cs.ualberta.ca/aixplore à AI Exploratorium 8) 55) e. -١‏ شجرة 
القرارات. اقرأ السرد على إحصائيات لعبة كرة السّلة. افحص البيانات» ثم أنشئْ شجرة 
قرار. اكتب تقريرًا عن انطباعاتك عن دقة شجرة القرارات هذه. استكشف أيضًا تأثيرات 
الخوارزميات المختلفة. 

۲- قم باستقصاء بعض أدوات التنقيب في البيانات ومورّديها. ابدأ .egain.com fico.com (ye Js‏ 
قم بزيارة موقع ۳٥ء.W‏ ۷1٠ل‏ وحَذّد بعض منتجات التنقيب ف البيانات ومقدّمي 
الخدمات غير المذكورة في هذا الفصل. 

*- ابحث عن حالات حديثة من تطبيقات التنقيب في البيانات الناجحة. قم بزيارة مواقع الويب 
لبعض مورّدي أدوات التنقيب ف البيانات» وابحث عن حالات أو قصص نجاح. ثم قم بإعداد 
تقرير يُلخْص خمس دراسات حالة جديدة. 

«Teradata /Cognoss -SPSSs S48 انتقل إلى مواقع الويب الخاصة بالبائعين (خاصة‎ -٤ 
على قصص النجاح الخاصة بأدوات ذكاء الأعمال‎ gblş (Fair Isaacg StatSoftg 
(4.آ0 والتنقيب في البيانات). ما الذي تشترك فيه قصص النجاح امختلفة؟ كيف تختلف؟‎ 

5- انتقل إلى 5]85011.602 (وهي إحدى شركات (OI Dell‏ قم بتنزيل ثلاث ورقات بيضاء 
على الأقل حول التطبيقات. أيّ من هذه التطبيقات رها استخدم تقنيات تعدين البيانات / 
النصوص / الويب التي تمت مناقشتها في هذا الفصل؟ 

1- اذهب إلى ۳٠ء.ءي‏ وقم بتنزيل ثلاث وثائق بيضاء على الأقل حول التطبيقات. أي من هذه التطبيقات 
رها استخدم تقنيات تعدين البيانات / النصوص / الويب التي تمت مناقشتها في هذا الفصل؟ 
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- انتقل إلى 2دمء.ووم؟ (شركة 1881). قم بتنزيل ثلاث ورقات بيضاء على الأقل حول التطبيقات. 
أي من هذه التطبيقات ربما استخدم تقنيات تعدين البيانات / النصوص / الويب التي تمت 
مناقشتها في هذا الفصل؟ 

8- انتقل إلى «م».6:208]8). قم بتنزيل ثلاث ورقات بيضاء على الأقل حول التطبيقات. أي من 
هذه التطبيقات ربما استخدم تقنيات تعدين البيانات / النصوص / الويب التي مت مناقشتها 
في هذا الفصل؟ 

؟- انتقل إلى 560.6082. قم بتنزيل ثلاث ورقات بيضاء على الأقل حول التطبيقات. أي من هذه 
التطبيقات رها استخدم تقنيات تعدين البيانات / النصوص / الويب التي ممت مناقشتها في 
هذا الفصل؟ 

-٠١‏ انتقل إلى .salfordsystems.com‏ 5 بتنزيل ثلاث ورقات بيضاء على الأقل حول التطبيقات. 
gi‏ من هذه التطبيقات رها استخدم تقنيات تعدين البيانات / النصوص / الويب التي تت 
مناقشتها في هذا الفصل؟ 

-١١‏ انتقل إلى 12ه».01601:651:. قم بتنزيل ثلاث ورقات بيضاء على الأقل حول التطبيقات. 
أي من هذه التطبيقات رها استخدم تقنيات تعدين البيانات / النصوص / الويب التي مت 
مناقشتها في هذا الفصل؟ 

-١١‏ انتقل إلى «زمه.واءوعناصل!. استكشف الأقسام على التطبيقات وكذلك البرامج. ابحث عن 
أسماء ثلاث حزم إضافية على الأقل للتنقيب في البيانات وتنقيح النصوص. 
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التحليلات التنبؤية (۲) 
تحليلات النص والويب ووسائل التواصل الاجتماعي 


أهداف التعلم: 
- وصف تحليلات النصوص وفهم الحاجة إلى التنقيب في النص. 
- التمييز بين تحليلات النصوص, والتنقيب في النص» والتنقيب في البيانات. 
- فهم المجالات المتنوعة لتطبيق التنقيب في النص. 
- التعرف على عملية تنفيذ مشروع التنقيب في النص. 
- التعرف على الطرق المختلفة لهيكلة البيانات النصية. 
- وصف تحليل المشاعر. 
- رفع مستوى الإلمام بالتطبيقات الشائعة لتحليل المشاعر. 
- تعلم الطرق الشائعة لتحليل المشاعر. 
- التمرس على تحليلات الكلام كما ترتبط بتحليل المشاعر. 

يقدم هذا الفصل نظرةٌ شاملة على تحليلات / التنقيب في النصوص / الويب. بالإضافة إلى 
مجالات التطبيق الشائعة مثل محركات البحث وتحليل المشاعر وتحليلات الشبكات / وسائل 
التواصل الاجتماعي. وكما شهدنا في السنوات الأخيرة» فإن البيانات غير المهيكلة التي يتم إنشاؤها 
عبر الإنترنت (الويب. وشبكات الاستشعارء وأنظمة التعرف على [RFID] pol olos‏ 
وشبكات المراقبة» إلخ) تزداد بسرعة هائلة وليس هناك مؤشر على تباطئها. تُجير هذه الطبيعة 
المتغيرة للبيانات المنظمات على جعل تحليلات النص والويب جزءًا حساسًا من بنيتها التحتية فيما 
يخص ذكاء / تحليلات الأعمال. 


١-5‏ مقال افتتاحي: الآلة مقابل الإنسان على åa Jeopardy‏ واتسون: 


هل تستطيع الآلة التغلب على أفضل ما في الإنسان فيما يفترض أن يكون الإنسان هو الأفضل 
فيه؟ يبدو أن الإجابة هي: نعم واسم الآلة هو واتسون. حيث يعتبر واتسون هو نظام حاسب 
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استثنائي (مزيج جديد من الأجهزة والبرامج المتقدمة) مصمم للإجابة على الأسئلة المطروحة 
باللغة البشرية الطبيعية. وقد تم تطويره في عام ٠٠١٠١‏ من قبل فریق IBM Research‏ كجزء 
من مشروع 004 واستمد اسمه من أول رئيس لشركة 18231 $55 "Thomas J. Watson‏ 


خلفىة: 


منذ ما يقرب من ۳ سنوات» کانت 18M ۸۲۴۹۲٥۸‏ تبحٹ عن ias Aod‏ كبير لمجاراة 
الاهتمامات العلمية والشعبية ل ٠٠ا8‏ و٥0‏ بطل لعبة الش طرنج على الحاسب والذي قد 
يرت ط بعلاقة واضحة بالاهتمامات التجارية الخاصة بشركة 18۷. كان الهدف هو تطوير علوم 
الحاسب من خلال استكشاف طرق جديدة لتقنية الحاسب تؤثر على العلوم والأعمال التجارية 
والمجتمع. وبناءً IBM Research Cë US de‏ تحديًا ببناء نظام حاسب يمكن أن ينافس على 
لقب بطل العالم بشكل فوري لبرنامج مسابقة التليفزيون الأمريي إ3:2م160! وقد شمل نطاق 
التحدي مشاركة متسابق آلي بشكل فوري للعرض التليفزيونيء ويكون لديه القدرة على الاستماع 
والفهم والاستجابةء وليس مجرد تمرين معملي. 
التنافس ضد الأفضل: 

في عام 2701١‏ وكاختبار لقدراته» تنافس واتسون على مسابقة :2م160 في أول مباراة بين 
البشر والآلة. في مباراة ثنائية مجمعة النقاط (تم بثها عبر ثلاث حلقات من العرض التلفازي 
à Jeopardy‏ الفترة 17-١‏ فبراير)ء فاز واتسون على 121561 8124 أكبر رابح با مال على الإطلاق في 
Ken Jennings sg Jeopardy‏ حامل الرقم القياسي لأطول فترة بالبطولة وهي Vo)‏ يومًا). à‏ 
هذه الحلقات» استمر واتسون في التفوق على خصومه من البشر وفقًا لجهاز إشارات اللعبةء لكنه 
واجه صعوبة في الرد على بعض الفئات. خاصةً أولئك الذين لديهم أدلة قصيرة تحتوي فقط على بضع 
كلمات. استطاع واتسون الوصول إلى ٠٠١‏ مليون صفحة منظمة / غير منظمة المحتوى ومخزنة على 
€ تيرابايت من إجمالي السعة التخزينية للقرص. وم يكن واتسون متصلًا بالإنترنت خلال المباراة. 

أعلن أحد المختصين في لقاء تلفازي oi Jeopardy 5s‏ التحدي المطلوب هو التقدم ودمج 
مجموعة متنوعة من تقنيات ضمان الجودة (التنقيب في النصوص ومعالجة اللغات الطبيعية)» 
ها في ذلك التحليل اللفظيء وتصنيف الأسئلة وتحليله ا واقتناء المصادر بصورة تلقائية وتقييمهاء 
واكتشاف الكيان والعلاقة. وتكوين النماذج المنطقية, وتمثيل المعرفة والتفكير. وأضاف أن الفوز 
في :2م160 يتطلب أن تتحلى إجاباتك بثقة في الحوسبة بصورة عالية الدقة. وفي الوقت الذي 
تكتسي فيه الأسئلة والمحتوى بالغموض والضجيج. ولا يتمتع أي من الخوارزميات الفردية بالكمال. 
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لذلك؛ يجب أن يقدم كل مكون مخرجاته بدرجة من الثقةء كما يجب تجميع درجات الثقة لكل 
المكونات الفردية للقيام بحساب الثقة الكلية للإجابة النهائية. ويتم استخدام الثقة النهائية 
لتحديد ما إذا كان ينبغي على نظام الحاسب المخاطرة باختيار الإجابة على أي حال. في لغة برنامج 
Jeopardy‏ تستخدم هذه الثقة لتحديد ما إذا كان الحاسب سوف يصدر ”رنيئًا“ أو ”طنينًا“ لسؤال 
ما. وهنا يجب أن يتم حساب الثقة خلال الوقت الذي تتم فيه قراءة السؤال وقبل فرصة صدور 
الرنين للسؤال. ويقدر هذا الوقت تقريبًا ما بين ثانية واحدة إلى 1 ثوانٍ بمتوسط ١‏ ثوان تقريبًا. 
كيف يفعل واتسون ذلك؟ 
إن نظام واتسونء والذي يدعى 1066504 هو بنية حسابية متوازية وواسعة النطاق تركز 
على التنقيب في النصوصء وتستند إلى الأدلة الاحتمالية. وبالنسبة patul Jeopardy gaai‏ 
واتسون أكثر من ٠٠١‏ طريقة مختلفة لتحليل اللغة الطبيعيةء وتحديد المصادرء وإيجاد وتوليد 
فرضيات» وإيجاد الأدلة وإعطائها نقاطء ودمج وترتيب الفرضيات. وما هو أهم بكثير من أي 
تقنية تم استخدامها هو كيفية دمجهم في 162004 بحيث كن للطرق المتداخلة أن تستحضر 
نقاط قوّتها للإنتاج والمساهمة في تحسين JS‏ من الدقة والثقة والسرعة. 
تعتبر 1066004 بنية ذات منهجية مصاحبةء وهي ليست خاصة بتحدي (210م160. وتشكل 
المبادئ الشاملة في 04م262 توازيًا هائلًا وعديدًا من الخبراء وتقديرًا للثقة ا منتشرة. وتكاملًا 
في تحليلات النص بصورة أحدث وأعظم. 
- التوازي الهائل: يفيد التوازي الهائل في النظر في تفسيرات وفرضيات متعددة. 
- العديد من الخبراء: يسهل التكامل والتطبيق والتقييم السياقي لمجموعة واسعة من تحليلات 
الأسئلة والمحتوى الاحتمالي المتباعدين عن بعضهما. 
- تقدير الثقة المنتشرة: لا يلتزم أي عنصر بأي إجابة؛ فجميع المكونات تنتج ميزات ومستوى الثقة 
المرتبطة بهاء وسجل تفسيرات مختلفة للأسئلة والمحتوى. حيث تقوم الركيزة الأساسية لمعالجة 
الثقة بالتعرف على كيفية تكديس النتائج ودمجها. 
- تكامل المعرفة السطحية والعميقة: ويتم ذلك عن طريق الموازنة في استخدام الدلالات الصارمة 
والسطحية: والاستفادة من العديد من التجميعات التي تكونت بشكل يتسم بالأريحية. 
يوضح الشكل )١-١(‏ بنية عالية المستوى ل 04م17626. ولمزيد من التفاصيل الفنية حول 
المكونات المختلفة لهذه البنية وأدوارها وقدراتها المحددة انظر: 7202 وآخرين (Y-A)‏ 
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DeepQA àJ gguubl تصوير عالي‎ :١-5 شكل‎ 
استنتاج:‎ 


ساعد تحدي :لم120 شركة 1831 في جمع المتطلبات التي أدت إلى تصميم بنية DeepQA‏ 
وتنفيذ برنامج واتسون. وبعد ا سنوات من البحث والتطوير المكثف من قبل فريق أساسي 
يتكون تقريبًا من ٠١‏ باحنّاء يعمل واتسون في العرض التلفازي للسابقة 2م120 على مستويات 
عالية من الخبرة البشرية من حيث الدقة والثقة والسرعة. 

تزعم 1834 أنها طورت العديد من الخوارزميات الحسابية واللغوية لمعالجة أنواع مختلفة 
من القضايا والمتطلبات فيما يخص ضمان الجودة. وعلى الرغم من أن بواطن هذه الخوارزميات 
غير معروفة إلا أنها حققت أقصى استفادة من تحليلات النص والتنقيب في النص. وتعمل شركة 
4 الآن على إصدار واتسون للتعامل مع المشكلات التي يمكن التغلب عليها في مجال الرعاية 
(Y W «05,515 Feldman) cul àisuaJl‏ 
ماذا يمكننا أن نتعلم من هذه المقالة القصيرة: 

مما لا شك فيه أن تقنية الحاسب - سواء الأجهزة أو واجهات البرامج - تتقدم بشكل أسرع 
من أي شيء آخر في الخمسين سنة الماضية. إن الأشياء التي كانت كبيرة جدًا ومعقدة جدًّا ومن 
المستحيل حلهاء أصبحت الآن في متناول تقنية المعلومات. وتعتبر تحليلات / التنقيب في النص 
إحدى التقنيات التمكينية المستخدة في ذلك. وقد تم إنشاء قواعد بيانات لتركيب البيانات 
بحيث هكن معالجتها بواسطة أجهزة الحاسب. من ناحية أخرىء كان المقصود بالنسبة للنص أن 
تتم معالجته بواسطة البشر. والسؤال الذي يطرح نفسه هناء هل يمكن للآلات القيام بالأشياء 
التي تتطلب إبداع الإنسان وذكاءه» وهي مم تصمم أصلا للآلات؟ من الواضح أن الإجابة: نعم. 
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فيعتبر واتسون مثالا رائعًا على المسافة التي قطعناها في معالجة المستحيل. وقد أصبحت أجهزة 
الحاسب الآن ذكية بما يكفي للقيام بدور البشر فيما نعتقد أن البشر هم الأفضل في هذا المجال. 
إن فهم السؤال الذي تم طرحه في اللغة البشرية المنطوقة» ومعالجته وفهمه فهمًا جيدًا والبحث 
عن إجابة له. والرد عليه في غضون ثوان قليلة كان شيئًا لم يكن بإمكاننا تصوره قبل أن يفعله 
واتسون فعلًا. وفي هذا الفصلء ستتعلم الأدوات والتقنيات التي قام عليها واتسون والعديد من 
الأجهزة الذكية الأخرى والتي صنعت المعجزات من أجل معالجة المشاكل التي كان يُعتقد في يوم 
من الأيام أنه من المستحيل حلها. 
أسئلة مراجعة على المقالة الافتتاحية: 
6- ما هو واتسون؟ ما هو المميز فيه؟ 
/ا- ما هي التقنيات المستخدمة في بناء واتسون (سواء من الأجهزة أو من البرامج)؟ 
ما هي الخصائص ال مبتكرة لبنية 1066504 التي صنعت تفوق واتسون؟ 
4- اذا أنفقت 18۷M‏ كل هذا الوقت وامال لبناء واتسون؟ أين عائد الاستثمار SRON‏ 
۲-٥١‏ نظرة عامّة على تحليلات النص والتنقيب في النص: 

يتميز عصر المعلومات الذي نعيش فيه بالنمو السريع في كمية البيانات والمعلومات التي 
يتم جمعها وتخزينها وإتاحتها في شكل إلكتروني. حيث يتم تخزين الغالبية العظمى من بيانات 
الأعمال في وثائق نصية غير منظمة فعليًا. ووفقًا لدراسة أجراها Merrill Lynch ya JS‏ 
Gartners‏ فإن 80“ من جميع بيانات الشركة يتم التقاطها وتخزينها في شكل غير منظم 
S> 48g (McKnight, 2005)‏ نفس الدراسة أيضًا أن هذه البيانات غير المنظمة يتضاعف 
حجمها كل ١86‏ شهرًا. ونظرًا لأن المعرفة تمثل قوة في عام الأعمال اليوم, بالإضافة إلى أنها مستمدة 
من البيانات والمعلوماتء فإن الشركات التى تستفيد بكفاءة وبشكل فعال من مصادر البيانات 
النصية يكون لديها المعرفة اللازمة لاتخاذ قرارات أفضلء مما يجعلها تتميز في المنافسة عن تلك 
الشركات التي تتخلف عن الركب. وهذا تماما هو المكان الذي تتناسب فيه الحاجة إلى تحليلات 
النصوص والتنقيب في النص مع الصورة الكبيرة الحالية للأعمال التجارية. 

وعلى الرغم من أن الهدف الرئيس لكل من تحليلات النصوص والتنقيب في النص هو تحويل 
البيانات النصية غير المهيكلة إلى معلومات قابلة للتطبيق من خلال تطبيق معالجة اللغات الطبيعية 
)N12(‏ والتحليلات» حيث إن تعريفاتها مختلفة بعض الشيء. على الأقل بالنسبة لبعض خبراء هذا 
ا مجال. ووفقًا لهؤلاء الخبراء فإن مفهوم تحليلات النص هو مفهوم أوسع حيث يشمل استرجاع 
المعلومات (مثل البحث وتحديد الوثائق ذات الصلة لمجموعة معينة من ا مصطلحات الرئيسة)» 
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وكذلك استخراج المعلومات» والتنقيب في البيانات» والتنقيب في الويبء في حين يركز التنقيب في 
النص في المقام الأول على اكتشاف معرفة جديدة ومفيدة من مصادر البيانات النصية. ويوضح 
الشكل (7-0) العلاقات بين تحليلات النصوص والتنقيب في النص إلى جانب مناطق التطبيق الأخرى 
ذات الصلة. ويبين الجزء السغلي من الشكل (5-؟) التخصصات الرئيسة (أساس التصميم) التي 
تلعب دورًا حساسًا في تطوير مجالات التطبيق الأكثر انتشارًا بشكل متزايد. وبناءٌ على هذا التعريف 
لتحليل النصوص, والتنقيب في النصء فإنه يمكن ببساطة حساب الفرق بينهما كما يلي: 

تحليلات النص - استرجاع المعلومات + استخراج المعلومات + التنقيب في البيانات + التنقيب في الويب. 

أو ببساطة: تحليلات النص - استرجاع المعلومات + التنقيب في النص. 














شكل 5ه-": تحليلات النص والتطبيقات ال مرتبطة والتخصصات التمكينية 


Sources: Ferrucci, D., Brown, E., Chu-Carroll, J., Fan, J., Gondek, D., Kalyanpur, A. A.,... Welty, C. (2010). 
Building Watson: An overview of the DeepQA Project. AI Magazine, 31(3); DeepQA. DeepQA Project: 
FAQ, IBM Corporation (2011). research.ibm.com/deepqa/faq.shtml (accessed January 2013); Feldman, 
S., Hanover, J., Burghard, C., & Schubmehl, D. (2012). Unlocking the power of unstructured data. IBM 


white paper. www-01.ibm.com/software/ebusiness/jstart/downloads/unlockingUnstructuredData.pdf 
(accessed February 2013). 
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ويُعد مصطلح تحليلات النصوص مصطاحًا جديدًا نسبيًا بالمقارنة مع مصطلح التنقيب في 
النص؛ إذ يركز مصطلح تحليلات النصوص على التحليلات» وكما هو الحال في العديد من مجالات 
تطبيقات التقنية الأخرى ذات الصلة (مثل تحليلات المستهلكء والتحليلات الكاملة. والتحليلات 
ا مرئية. والتحليلات الاجتماعية) فإن مجال النص يحتاج أيضًا إلى الحصول على مُحاكاة للتحليلات. 
وعلى الرغم من استخدام مصطلح تحليلات النصوص بشكل أكثر انتشارًا في سياق تطبيق الأعمالء 
إلا أن مصطلح التنقيب في النص يستخدم بشكل متكرر في دوائر البحث الأكاديمية. ورغم أنه 
في بعض الأحيان قد يتم تعريف مصطلحي (تحليلات النص والتنقيب في النص) بطريقة مختلفة 
بعض الشيء. إلا أنهما يستخدمان بشكل مترادف. 

التنقيب في النص (ويُعرف أيضًا باسم التنقيب في البيانات النصية» أو اكتشاف المعرفة في قواعد 
البيانات النصية) هو عملية شبه آلية لاستخلاص الأنماط (المعلومات والمعرفة المفيدة) من كميات 
كبيرة من مصادر البيانات غير المهيكلة. والجدير بالذكر أن التنقيب في البيانات هو عملية تحديد 
أنماط صالحة ومبتكرة ومفيدة ومفهومة في بيانات مخزنة في قواعد البيانات المنظمة» حيث يتم 
تنظيم البيانات في سجلات منظمة من خلال متغيرات فئوية أو ترتيبية أو مستمرة. ويُعد التنقيب في 
النص هو نفسه التنقيب في البيانات من حيث استهدافه لنفس الغرض واستخدامه لنفس العمليات» 
ولكن مع التنقيب في النص ينطوي الإدخال إلى العملية على مجموعة من ملفات البيانات غير 
المهيكلة (أو الأقل تنظيمًا)» مثل: وثائق ۷0۲۵ وملفات ۲2۴ والمقتبسات النصية وملفات .200/1 
وما إلى ذلك. ويمكن اعتبار التنقيب في النص في جوهره كعملية (ذات خطوتين رئيسيتين) تبدأ بفرض 
هيكلة مصادر البيانات المستندة إلى النص يتبعها استخلاص المعلومات والمعارف ذات الصلة من 
هذه البيانات المهيكلة والمستندة إلى النصء وذلك باستخدام تقنيات وأدوات التنقيب في البيانات. 

وتظهر فوائد التنقيب في النص بوضوح في المجالات التي يتم فيها توليد كميات كبيرة من 
البيانات النصيةء مثل القانون (أوامر ا لحكمة). والبحوث الأكادممية (المقالات البحثية)» والتمويل 
(تقارير فصلية). بالإضافة إلى الطب (ملخصات التفريغ)» وعلم الأحياء (التفاعلات الجزئية)» 
والتقنية (ملفات براءات الاختراع)» فضلاً عن التسويق (تعليقات العملاء). فعلى سبيل المثال» 
يمكن استخدام التفاعلات النصية القائمة على النموذج الحر مع العملاء في شكل شكاوى (أو 
مدح) ومطالبات الضمان من أجل تحديد خصائص ال منتجات والخدمات التي تعتبر أقل من مثالية 
بشكل موضوعيء ويمكن اس تخدامها كمدخلات لتطوير منتجات أفضل ومخصصات الخدمة. 
وبالمثل» فإن برامج التوعية السوقية ومجموعات التركيز تولد كميات كبيرة من البيانات. ويمكن 
للعملاء تقديم أفكارهم حول منتجات وخدمات الشركة بأسلوبهم الخاصء وذلك من خلال عدم 
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تقييد التعليقات على المنتجات أو الخدمات أو جعلها مقننة. ومن المجالات الأخرى التى أثرت 

فيها المعالجة الآلية للنص غير المنظم تأثيرا كبيرا مجال الاتصالات الإلكترونية والبريد الإلكتروني. 

والجدير بالذكر أن التنقيب في النص لا يُستخدم فقط لتصنيف وتصفية البريد الإلكتروني غير 

الهام» Ulo‏ يمكن اس تخدامه أيضًا لتحديد أولويات البريد الإلكتروني تلقائيًا استنادًا إلى مستوى 

الأهمية بالإضافة إلى إنشاء ردود تلقائية (2004 ,ناذآ :8 عم186). ونذكر فيما يلي مجالات 

التطبيق الأكثر شيوعًا في التنقيب في النصوص: 

- استخراج المعلومات: تحديد العبارات والعلاقات الرئيسة داخل النص من خلال البحث عن 
الكائنات والتسلسلات المحددة مسبقًا في النص عن طريق مطابقة النمط. 

- تتبع الموضوع: استنادًا إلى ملف تعريف المُستَخدم بالإضافة إلى الوثائق التي تحتوي على 
وجهات نظر eaa all‏ فإن التنقيب في النص يمكنه التنبؤ بالوثائق الأخرى التي تهم المستخدم. 

- التلخيص: تلخيص الوثيقة توفي للوقت من جانب القارئ. 

- التصنيف: تحديد الموضوعات الرئيسة للوثيقة ثم وضعها في مجموعة كبيرة محددة مسبقًا من 
الفئات بناءٌ على تلك الموضوعات. 

- التجميع: تجميع وثائق مشابهة بدون وجود مجموعة محددة مسبقًا من الفئات. 

- ربط مفهوم: ربط الوثائق ذات الصلة من خلال تحديد المفاهيم المشتركة, وبذلك يساعد ال مستخدمين 
في الوصول إلى المعلومات التي قد يصعب الوصول إليها باستخدام الطرق التقليدية. 

- إجابة السؤال: إيجاد أفضل إجابة لسؤال معين من خلال مطابقة النمط القائم على المعرفة. 

وللحصول على شرح لبعض المصطلحات والمفاهيم المستخدّمة في التنقيب في النص انظر رؤية 
فنية »)١-0(‏ في حين توضح الحالة العملية )١-0(‏ استخدام التنقيب في النص في صناعة التأمين. 


رؤية فنية ١-0‏ 
مصطلحات التنقيب في النص 
توضح القائمة التالية بعض مصطلحات التنقيب في النص شائعة الاستخدام 
- بيانات غير مهيكلة (مقابل البيانات المهيكلة): للبيانات المهيكلة صيغة محددة مسبقًاء 
وعادةً ما يتم تنظيمها في سجلات ذات قيم بيانات بسيطة (فئوية وترتيبية ومتغيرات 
مستمرة) ومخزنة في قواعد البيانات. وفي المقابلء فإن البيانات غير المهيكلة لا تحتوي على 
صيغة محددة مسبقاً ويتم تخزينها في شكل وثائق نصية. وتستخدم أجهزة الحاسوب 
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EY 


البيانات المهيكلة في جوهرها للقيام بالمعالجة» في حين تُستخدم البيانات غير المهيكلة 
بواسطة البشر للمعالجة والفهم. 

- مجموعة القوانين ونام,00: (جمع yds (corpora‏ لغويًا بأنها مجموعة كبيرة ومنسقة من 
النصوص (التي عادةً ما يتم تخزينها ومعالجتها إلكترونيًا) تم إعدادها بغرض إجراء اكتشاف المعرفة. 

- المصطلحات: المصطلح هو عبارة عن كلمة واحدة أو عبارة متعددة الكلمات مستخرجة مباشرة 
من مجموعة قوانين خاصة بمجال معين عن طريق أساليب معالجة اللغات الطبيعية NLP‏ 

- المفاهيم: هي مواصفات يتم إنشاؤها من مجموعة من الوثائق عن طريق الوسائل 
اليدوية أو منهج تصنيف إحصائي أو قائم على القواعد أو مزيج ما بين كل ذلك. ومقارنة 
بالمصطلحات, تكون المفاهيم نتيجة لفكرة تجريدية على مستوى أعلى. 

- الاشتقاق عسندةدم»)]5: وهو عملية تقليل الكلمات المصرفة إلى أصلها (أو قاعدتها أو 
جذرها). على سبيل اممٹال: stem mer, stemming, sted‏ كلها كلمات مشتقة 
من الأصل وهو stem‏ 

- كلمات التوقف: كلمات التوقف (أو كلمات الضجيج) وهي كلمات يتم تصفيتها قبل 
أو بعد معالجة بيانات اللغة الطبيعية (بمعنى النص). وعلى الرغم من عدم وجود 
قائمة مقبولة عاليًا لكلمات التوقفء فإن معظم أدوات معالجة اللغات الطبيعية N1۲‏ 
تستخدم E «à, am, the, of) paas él‏ والأفعال ds, are, was, were) 8aeLu4l‏ 
إلخ)» والكلمات المتعلقة بالسياق والتي تعتبر غير مميزة. 

- المرادفات والمتجانسات: المرادفات هي كلمات مختلفة نحويًا (أي مختلفة هجائيًا) لكن 
ذات معان متماثلة أو على الأقل متشابهة (مثل السينما والأفلام والصور المتحركة). وفي 
baile ole «Jail‏ والتي تسمى أيضًا المشتركات اللفظية هي كلمات متطابقة نحويًا 
(أي متشابهة تمامًا من الناحية الهجائية) لكنها ذات معان مختلفة (فمقلاء القوس هكن أن 
يعني ”الانحناء إلى الأمام“» أو ”واجهة السفينة“ أو ”السلاح الذي يطلق السهام“ أو ”نوع 
من الأشرطة المربوطة“). 

- الترميز "121١8‏ 10: الرمز هو عبارة نصية يتم تصنيفها في جملة وفقًا للوظيفة التي 
تؤديها. ويعرف هذا التصنیف بالترمیز "121١8‏ اها. قد يبدو الرمز مثل أي شيء يحتاج 
أن يكون جزءًا نافعًا من النص اممهيكل. 

- قاموس المصطلحات: وهو مجموعة من ا مصطلحات الخاصة بمجال محدد والتي يمكن 
استخذامها تحصر المصطلحات ال مستخرجة من داخل مجموعة القوانين (كتام1م»). 
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- تكرار الكلمات: وهو عدد مرات العثور على كلمة ما في وثيقة ما. 

- وضع علامات لجزء من الكلام :Part-of-speech tagging‏ 525 عملية وسم كلمات في 
النص كمطابقة تجزء معين من الكلام (مثل الأسماء والأفعال والصفات وظرف الحال والزمان 
والمكان» وما إلى ذلك) بناءً على تعريف الكلمة والسياق الذي تستخدم فيه. 

- المورفولوجيا '(0108طام310: وهو فرع من علوم اللغة وجزء من معالجة اللغات الطبيعية (2.آ21) 
والذي يدرس الهيكل الداخلي للكلمات (أنماط تنسيق الكلمة داخل لغة ما أو فيما بين عدة لغات). 

- مصفوفة Term-by-document‏ (مصفوفة الأحداث): وهي مخطط تمثيلي شائع للعلاقة 
القائمة على التكرار بين المصطلحات والوثائق في شكل جدول حيث يتم وضع المصطلحات في 
أعمدة. والوثائق في صفوف. ويكون التكرار بين المصطلحات والوثائق في الخلايا كقيم صحيحة. 

- فك القيمة المفرد (فهرسة دلالات الألفاظ غير المباشرة): وهي طريقة تخفيض الأبعاد وتستخدم 
لتحويل J| term-by-document 454a‏ حجم مقبول عن طريق توليد تمثيل متوسط للتكرارت 
باستخدام طريقة معالجة بارعة للمصفوفة وهي طريقة مشابهة لتحليل المكونات الأساسية. 

حالة عملية ٠-١‏ 
مجموعة التأمين تعمل على تقوية إدارة المخاطر مع حل التنقيب في النص 
عندما تم طرح سؤال عن التحدي الأكبر الذي يواجه صناعة التأمين على السيارات 
التشيكية. لم يتردد دكتور 16011168 :26:6 رئيس فريق الخدمات الاكتوارية لمكتب 
التأمينات التشيكية (018) في التعبير عن ذلك بقوله: «تزداد مطالبات الإصابة الجسدية 
بشكل غير متناسب مقارنةٌ مطالبات تلف السيارة“. و18© هي منظمة مهنية لشركات 
التأمين في جمهورية التشيك والتي تتعامل مع المطالبات غير المؤمن عليها والدولية وغير 
المدونة لمأ يعرف باسم مسؤولية الطرف الثالث للسيارات. ويضيف ka‏ الم[ Peter‏ 
”وتمثل تعويضات الإصابة الجسدية الآن حوالي ٤٥‏ من المطالبات المقدمة ضد أعضائناء 
وستستمر هذه النسبة في التزايد بسبب التغييرات التشريعية الأخيرة“. 
وتتمثل إحدى الصعوبات التي تطرحها مطالبات الإصابة الجسدية على شركات 

التأمين في صعوبة التنبؤ بحجم الضرر المباشر من جراء حادث سيارة؛ إذ تتفاقم بعض 
الإصابات مع الوقت والتي لم تكن بتلك الحدة وقت الحادثء كما أن الإصابات التي قد 
تبدو طفيفة يمكن أن تتحول إلى حالات مزمنة. وفي السابق كانت شركات التأمين تقدّر 
بدقة مسؤوليتها عن الأضرار الطبية. وبصورة أدق كانت تستطيع إدارة مخاطرها وتوحيد 
مواردهها. ومع ذلكء فإنه نظرًا لأن المعلومات المطلوبة موجودة في وثائق غير مهيكلة 
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مثل تقارير الحوادث وتصريحات الشهود. فإن الأمر يستغرق وقثًا طويلًا للغاية بالنسبة 
للموظفين الأفراد لإجراء التحليل اللازم. 

ولتوسيع وإجراء تحليل آلي لكلٍ من تقارير الحوادث غير المهيكلة. وعبارات الشهود 
«SL JUS à uos‏ قامت °18 بنشر حل تحليل البيانات استنادًا على كل من Dell‏ 
Statistica p455 ^. a». .Statistica Text Miner ol z4ls Statistica Data Miner‏ 
Data Miner‏ مجموعة أدوات بديهية وسهلة الاستخدام. بحيث يمكن الوصول إليها 
حتى من قبل غير المحللين. 

ويعمل الحل على قراءة وكتابة البيانات بشكل عملي من جميع التنسيقات المعيارية 
للملف كما يعرض أدوات تنظيف بيانات قوية ومتطورة. كما أنه يدعم حتى ال مستخدمين 
المبتدئين باستخدام معالجات الاستعلام والتي تُسمى وصفات التنقيب عن البيانات» 
والتي تساعدهم في الوصول إلى الإجابات التي يحتاجونها بشكل أسرع. 

ومع Statistica Text Miner alAzal‏ يصل المستخدمون إلى أدوات الاستخراج والاختيار 
اللازمة لفهرسة وتصنيف وتجميع المعلومات من مجموعات كبيرة من البيانات النصية غير 
المهيكلةء مثل صيغ مطالبات التأمين. وبالإضافة إلى استخدام حل 51815012 لعمل تنبؤات 
حول مطالبات الأضرار الطبية المستقبلية. فيمكن استخدام 018 أيضًا لإيجاد الأماط التي 
تكشف محاولات الاحتيال أو لتحديد التحسينات المطلوبة للسلامة على الطريق. 

تحسينات في دقة تقديرات المسؤولية: 

ويتوقع ol Jedlic"ka‏ يقوم حل 518150168 بتحسين قدرة 018 بشكل كبير على 
التنبؤ با مطالبات الطبية الكلية التي قد تنشأ عن أي حادث؛ إذ يقول: ”إن قدرات 
التنقيب في البيانات في مجال الإحصاء والتنقيب في النصوص تساعدنا بالفعل على كشف 
خصائص مخاطر إضافية, مما يجعل من الممكن التنبو بالادعاءات الطبية الخطيرة في 
المراحل الأولى من التحقيق. ومع Statistica (Je‏ يمكننا تقديم تقديرات أكثر دقة من 
إجمالي الأضرار والتخطيط وفقًا لذلك“. 

توسعات في عروض الخدمات للأعضاء: 

ومما زاد من سعادة !"16011 أيضًا من حل 5815162 هو أنه مكن 0178 من 
تقديم خدمات إضافية لأعضاء شركاتهاء حيث يقول: ”نحن في نشاط قائم على البيانات. 
Statistica gag‏ مكننا تزويد أعضائنا بتحليلات مفصلة للمطالبات واتجاهات السوق. 
كما تساعدنا 5]]15]102 في تقديم توصيات أقوى بشأن احتياطيات المطالبات“. 
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البديهية بالنسبة لمستخدمي الأعمال: 

يمكن الوصول إلى أدوات 569815668 البديهية حتى من قبّل المستخدمين غير الفنيين. 
وفي هذا الصدد يقول 16011"12: “من السهل فهم مخرجات تحليلات الإحصائيات بالنسبة 
لمستخدمي الأعمال. ويكتشف مستخدمو الشركات أيضًا أن نتائج التحليل تسير على نفس 
نهج تجاربهم وتوصياتهم» لذا فبإمكانهم أن يشعروا بسهولة بقيمة حل 12)ناها؟". 

أسئلة للمناقشة: 

-١‏ كيف يمكن استخدام تحليلات النص والتنقيب فيه للواكبة الاحتياجات التجارية 
المتغيرة لشركات التأمين؟ 

L -Y‏ هي التحديات والحل المقترح والنتائج التي تم الحصول عليها؟ 

- هل يمكنك التفكير في استخدامات أخرى لتحليلات النصوص والتنقيب في النص 
لشركات التأمين؟ 
Sources: Dell Statistica Case Study. Insurance group strengthens risk management‏ 
with text mining solution. https://software.dell.com/casestudy/czech-insurers-‏ 


bureau-insurance-group-strengthens- risk-management-with875134/(accessed June 
2016). Used by permission from Dell. 


أسئلة مراجعة على القسم 0-: 

-١‏ ما هي تحليلات النص؟ وكيف تختلف عن التنقيب في النص؟ 
la -Y‏ هو التنقيب في النص؟ وكيف يختلف عن التنقيب في البيانات؟ 
ISU -Y‏ يزداد انتشار التنقيب في النص كأداة تحليلية؟ 

ع- ما هي بعض مجالات التطبيق الأكثر انتشارًا في التنقيب في النص؟ 


:)211.2( معالجة اللغات الطبيعية‎ ٠-٥ 

تستخدم بعض تطبيقات التنقيب المبكر في النص تمثيلًا مبسطًا يُسمى حقيبة الكلمات وذلك 
لإضفاء الهيكلة على مجموعة من الوثائق النصية لتصنيفها إلى فئتين أو أكثر من الفئات المحددة 
مسبقًا أو تجميعها في تجمعات طبيعية. وفي نموذج حقيبة الكلمات» يتم تمثيل النص - جملة أو 
فقرة أو وثيقة كاملة - كمجموعة من الكلمات. دون تجاهل قواعد أو ترتيب ظهور الكلمات. 
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ولايزال نموذج حقيبة الكلمات يستخدم في بعض أدوات تصنيف الوثائق البسيطة. فمثلا في 
تصفية الرسائل غير ا مرغوب فيهاء يمكن تصميم رسالة البريد الإلكتروني كمجموعة غير مرتبة من 
الكلمات (حقيبة كلمات) تتم مقارنتها بحقيبتين مختلفتين محددتين مسبقًاه حيث تمتلئ حقيبة 
واحدة بالكلمات الموجودة في رسائل البريد غير المرغوب فيه والأخرى مليئة بكلمات تم العثور 
عليها في رسائل البريد الإلكتروني الاعتيادية. وعلى الرغم من أنه من المتوقع وجود بعض الكلمات 
في كلا الحقيبتينء فإن حقيبة ”البريد غير المرغوب فيه“ تتكرر فيها كلمات تتعلق بالرسائل غير 
المرغوب فيها - مثل المخزونء والفياجراء والشراء - أكثر من تكرارها في الحقيبة الاعتيادية» والتي 
ستحتوي على المزيد من الكلمات المتعلقة بأصدقاء المستخدم أو مكان العمل. ويقوم مستوى 
التماثل بين حقيبة الكلمات الخاصة بالبريد الإلكتروني والحقيبتين اللتين تحتويان على التوصيفات 
بتحديد البريد الإلكتروني على أنها إما رسائل غير مرغوب فيها أو اعتيادية. 

وبطبيعة الحالء لا نستخدم نحن (البشر) كلمات غير ذات ترتيب أو هيكلء بل نستخدم 
كلمات في جمل لها بنية دلالية ونحوية. وبالتالي» فإنه يجب أن تبحث التقنيات الآلية (مثل 
التنقيب في النص) عن طرق لتجاوز تفسير حقيبة الكلمات وتضمين بنية دلالية أكثر وأكثر في 
عملياتها. ويتجه التنقيب في النص حاليًا نحو تضمين العديد من المميزات المتقدمة التي يمكن 
الحصول عليها باستخدام معالجة اللغات الطبيعية N1۴‏ 

وقد اتضح أن طريقة حقيبة الكلمات قد لا تنتج محتوى معلومات كاف بشكل جيد لمهام 
التنقيب في النص (مثل التصنيفء والتجميع؛ والاقتران). وخير مثال على هذاء يمكننا الحصول 
عليه في الطب القائم على الأدلة. ويتمثل أحد المكونات الحساسة للطب القائم على الأدلة في 
دمج أفضل نتائج البحوث المتاحة في عملية اتخاذ القرارات الإكلينيكية. والتي تنطوي على تقييم 
المعلومات التي تم جمعها من وسائل التواصل المطبوعة بالنسبة لصلاحيتها ومدى صلتها. وقد 
طور العديد من الباحثين من جامعة ميريلاند نماذج تقبيم الأدلة باستخدام طريقة حقيبة الكلمات 
(Lin & Demner-Fushman, 2005)‏ .335 استخدموا أساليب تعلم الآلة الشائعة بالإضافة إلى 
MEDLINE (s lgxaz (3 Cau Osdls chai ga 351‏ (نظام تحليل وتحرير أدبيات الطب على 
الإنترنت). وقد قاموا بتمثيل كل ملخص كحقائب كلمات في النماذج التي قدموهاء حيث كان 
كل مصطلح محدد هثل ميزة. وعلى الرغم من استخدام أساليب التصنيف الشائعة مع منهجيات 
التصمي م التجريبي اب مجربةء فلم تعدو نتائج التنبؤ الخاصة بهم كونها مجرد تخمين بسيط مما 
يشير إلى أن حقيبة الكلمات لا تنتج تمثيلًا جيدًا مما فيه الكفاية للمواد البحثية في هذا المجال؛ 
وبالتالي فإن هناك حاجة إلى مزيد من التقنيات المتقدمة مثل معالجة اللغات الطبيعية N1۲‏ 
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وتعتبر معالجة اللغات الطبيعية (1.5آ21) أحد ال مكونات المهمة في التنقيب في النصوص» وهي 
عبارة عن مجال فرعي من الذكاء الاصطناعي وعلوم لغات الحاسوب. كما أنها تدرس مشكلة 
”فهم“ لغة الإنسان الطبيعيةء من وجهة نظر تحويل الصور البشرية (كالوثائق النصية) إلى تمثيلات 
أكثر رسمية d)‏ شكل بيانات رقمية ورمزية) تسهل على برامج الحاسب إجراء المعالجات المطلوبة 
ببراعة. والهدف من معالجة اللغات الطبيعية هو إجرء المعالجة البارعة للنصوص اطبنية على 
بناء الجملة (والذي غالبًا ما يطلق عليه ”عد الكلمات“) بشكل يوصل إلى فهم حقيقي ومعالجة 
اللغة الطبيعية التي تدرس القيود النحوية والدلالية وكذلك السياق. 
ويعتبر تعريف ونطاق كلمة الفهم أحد موضوع ات النقاش الرئيسية في معالجة اللغات 
الطبيعية «:211. وبالنظر إلى أن اللغة البشرية الطبيعية مبهمة» وأن الفهم الحقيقي للمعنى 
يتطلب معرفة واسعة بموضوع ما (يتجاوز ما هو موجود في الكلمات والجمل والفقرات)» فهل 
ستتمكن أجهزة الحاسب من فهم اللغة الطبيعية بنفس الطريقة وبنفس الدقة التي يفعلها البشر؟ 
والإجابة هي لا على الأغلب! لقد قطعت معالجة اللغات الطبيعية Égi NLP‏ طويلًا منذ وقت 
استخدام العد البسيط للكلمات, غير أن هذه المعالجة للغات الطبيعية لديها طريقة أطول لتتمكن 
من الفهم الحقيقي للغة الإنسان الطبيعية. ونذكر فيما يلي عددًا قليلًا من التحديات المرتبطة 
بشكل عام بتنفيذ معالجة اللغات الطبيعية :N1۲‏ 
- علامات جزء من الكلام: من الصعب ترميز المصطلحات ف النص على أنها تطابق جز٤ا‏ معينًا من 
Jia) I‏ الأسماء والأفعال والصفات والظروف) لأن جزء الكلام لا يعتمد فقط على تعريف 
المصطلح ولكن أيضًا على السياق الذي يتم استخدامه فيه. 
- تقسيم النص: بعض اللغات المكتوبة» مثل الصينية واليابانية والتايلاندية لا تحتوي على حدود 
مفردة للكلمات. وفي هذه الحالات فإن مهمة تحليل النص تتطلب تحديد حدود الكلمات, 
والتي غالبًا ما تكون مهمة صعبة. حيث تظهر تحديات مماثلة في تجزئة الكلام عند تحليل اللغة 
المحكية لأن الأصوات التي خمثل الحروف والكلمات المتعاقبة تمتزج مع بعضها البعض. 
- توضيح معنى كلمة: حيث توجد كلمات كثيرة لها أكثر من معنى واحد, ولا يمكن أن يتحقق 
اختيار المعنى الأكثر اعتيادية إلا بمراعاة السياق الذي تستخدم فيه الكلمة. 
- الغموض النحوي: حيث إن قواعد اللغة للغات الطبيعية غامضة؛ ولذلك فإن العديد من هياكل 
الجملة الممكنة في كثير من الأحيان تحتاج إلى النظر فيهاء حيث إن اختيار البنية الأكثر ملاءمة 
يتطلب عادةً انصهار المعلومات الدلالية والسياقية. 
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- عدم الكمال أو عدم انتظام المدخلات: اللهجات الأجنبية أو الإقليمية والعوائق الصوتية في 

الكلام والأخطاء اللطبعية أو النحوية في النصوص تجعل معالجة اللغة مهمة أكثر صعوبة. 
- أفعال لفظية: يمكن اعتبار الجملة في كثير من الأحيان إجراء من قبل المتحدث. فقد لا يحتوي 

هيكل الجملة وحده على معلومات كافية لتحديد هذا الإجراء. فعلى سبيل المثال: ”هل ممكنك 

اجتياز الصف؟“ يتطلب إجابة بسيطة؛ نعم / لاه في حين أن ”هل يكنك تمرير اللح؟“ هو طلب 

لإجراء مادي يجب القيام به. 

لقد طال انتظار هذا الحلم من جانب مجتمع الذكاء الاصطناعي في إيجاد خوارزميات قادرة 
على القراءة والحصول على المعرفة من النص. ومن خلال تطبيق خوارزمية تعمل على نص معقد. 
قام باحثون من NLP zida‏ بجامعة ستانفورد بتطوير طرق يمكنها تحديد المفاهيم والعلاقات 
بين تلك المفاهيم في النص تلقائيًا. ومن خلال تطبيق إجراء فريد على كميات كبيرة من النصوص» 
فإن خوارزمياتها تحصل تلقائيًا على مئات الآلاف من عناصر المعرفة العالمية وتستخدمها لإنتاج 
مستودعات معززة بشكل كبير ل غ180021©1. و180:03761 هي قاعدة بيانات مشفرة يدويا 
من الكلمات الإنجليزيةء وتعريفاتهاء ومجموعات من المرادفات» والعلاقات الدلالية المختلفة بين 
المجموعات المترادفة» وهي مورد رئيسي لتطبيقات معالجة اللغات الطبيعيةء ولكن ثبت أن تكلفة 
بنائها وصيانتها اليدوية مرتفعة للغاية. ومن خلال إحداث المعرفة تلقائيًا في 11/042161 فإنه 
توجد إمكانية لجعل 180503166 موردًا أكبر وأكثر شمولًا لمعالجة اللغات الطبيعية بجزء صغير 
من التكلفة. وتعد إدارة علاقات العملاء (/083) هي أحد المجالات البارزة التي تظهر فيها 
فوائد معالجة اللغات ]2:44 CRM 0B «ele aes). Jab WordNets (NLP)‏ يسعى 
بجدية إلى تقدير العملاء من خلال فهم أفضل واس تجابة فعالة لاحتياجاتهم الفعلية والمتوقعة. 
ويُعد تحليل المشاعر أحد المجالات المهمة في إدارة علاقات العملاء (/783©). حيث يكون للعالجة 
اللغات الطبيعية (811:2) تأثير كبير في تحليل المشاعر. وتحليل المشاعر هو تقنية نستخدم 
لكشف الآراء المؤيدة وغير المؤيدة تجاه منتجات وخدمات معينة باستخدام عدد كبير من مصادر 
البيانات النصية (ملاحظات العملاء في شكل منشورات على شبكة الإنترنت). وسوف نتناول في 
القسم 1-5 تحليل المشاعر و]18050716 بشيء من التفصيل. 
ويمكن استخدام التحليلات بشكل عام وتحليلات النصوص والتنقيب في النص بشكل خاص في 

صناعة البث الإذاعي. وتقدم الحالة العملية ۲-١‏ مثالًا على ذلك حيث يتم استخدام نطاق واسع من 
إمكانات التحليلات لالتقاط مشاهدين جدد وتوقع التقييمات وإضافة قيمة أعمال إلى شركات البث. 
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حالة عملية ۲-٥‏ 
استخدام شبكات 43140 التحليلات لجذب مشاهدين جدد وتقييم التوقعات وإضافة 
القيمة للمعلنين à‏ عام متعدد القنوات 

على مدى العشر سنوات الماضية كانت صناعة التلفاز المعتمد على كيبل في الولايات 
المتحدة تتمتع بفترة من النمو أتاحت إبداغًا غير مسبوق في إنشاء محتوى عالي الجودة. 
كانت شركة 7180115 4340 في طليعة هذ! العصر الذهبي الجديد للتلفان مما أدى 
إلى إنتاج سلسلة من العروض المشهود لها بالنجاح بشكل حاسم مثل: Breaking Bad‏ 
"Ihe Walking Deads Mad Mens‏ 

AMC Networks à 5,5 el 1:59‏ المتخصصة في إنتاج محتوى مرثي من البرامج 
والأفلام بجودة عالية منذ أكثر من ١‏ عامّاء العديد من العلامات التجارية الأكثر شعبية 
والحائزة على جوائز في مجال التلفاز المعتمد على كيبل» والتي تنتج وتقدم محتوى 
مميرًا وممتعًا وثقافيًا يجذب الجماهير عبر منصات متعددة. 

تصدر اللعبة: 

وعلى الرغم من نجاح شركة 15:ها»71 4310 إلا أنها لا تمتلك خططًا للبقاء على 
أمجادها. وقد وضح 151012 SVP Business Intelligence galz ge cao! .Vitaly‏ 
ذلك بقوله: ”نحن لا نقف هكذا بدون تقدم. فعلى الرغم من أن نسبة كبيرة من 
أعمالنا لا تزال تلفازًا خطيًاء إلا أننا نحتاج إلى جذب جيل جديد من جيل الألفية الذين 
يستهلكون المحتوى بطرق مختلفة جدًا. لقد تطور التلفاز ليصبح عملًا متعدد القنوات 
ومتعدد الأنظمةء ومن ثم فقد أصبحت الشبكات السلكية بحاجة إلى أن تكون أكثر 
ذكاءَ حول كيفية تسويقها والتواصل مع الجمهور عبر جميع تلك التدفقات. والجدير 
بالذكر أن الاعتماد على بيانات التقديرات التقليدية ومقدمي تحليلات الجهات الخارجية 
تعد إستراتيجية خاسرة: تحتاج إلى الحصول على ملكية بياناتك. واستخدامها للحصول 
على صورة أكثر ثراءً عن هوية المشاهدينء وماذا يريدون» وكيف كنك الحفاظ على 
انتباههم في سوق الترفيه المزدحم بشكل متزايد”. 

تقسيم المشاهدات: 

يتمثل التحدي في أن هناك الكثير من المعلومات المتاحة فقط - مثات المليارات من 
صفوف البيانات من مزودي خدمات بيانات الصنأعة ÈnٹJ «com-Scores Nielsen‏ 
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من قنوات TV Everywhere Jis‏ 41€ التي تعيش على شبكة الإنترنت وخدمات 
الفيديو حسب الطلبء من شركاء البيع بالتجزئة مثل iTunes‏ وه423820, وخدمات 
الفيديو عبر الإنترنت من جهات خارجية مûٹJ .Netflix and Hulu‏ 

يقول ز15۷ yاه)۷:‏ ”لا مكننا الاعتماد على ملخصات عالية المستوى؛ فنحن 
نحتاج إلى أن نكون قادرين على تحليل كل من البيانات المنظمة وغير المهيكلة» دقيقة 
بدقيقة ومشاهد مشاهد“ ويضيف قائلا: ”نحتاج إلى معرفة من يشاهد المحتوى وطاذاء 
ونحتاج إلى معرفة ذلك بسرعة حتى نتمكنء على سبيل المثالء من اتخاذ قرار بشأن ما إذا 
كان سيتم عرض إعلان أو عرض ترويجي في موضع معين خلال حلقة الرجال المجانين”. 

وقد قررت شركة 43/10 أنها بحاجة إلى تطوير القدرة التحليلية في مجال الصناعة 
داخل الشركة -وتركز على توفير هذه الإمكانية في أسرع وقت ممكن. وبدلًا من إجراء 
عملية اختيار طويلة ومكلفة للموردين والمنتجينء قررت شركة 42160 الاستفادة من 
علاقتها الحالية مع شركة 181/4 كشريكها التقني الإستراتيجي الموثوق به. وبدلًا من ذلك, 
فقد تم استثمار الوقت وامال الذي يتم إنفاقه تقليديًا على الشراء في تحقيق الحل -مما 
يسرع من تقدم ©4231 على خريطة الطريق الخاصة بتحليلاتها لمدة ١‏ أشهر على الأقل. 

تمكين قسم البحوث: 

لقد قضى فريق البحث في AMC‏ الماضي جزءً! كبيرًا من الوقت في معالجة 
البيانات. واليوم تمكنت 4810 من تركيز معظم طاقتها على اكتساب رؤى قابلة 
للتطبيق» وذلك بفضل أدوات التحليل الجديدة. 

biai JYS o” :Vitaly Tsivin Jai»‏ في تقنية تحليلات البيانات الضخمة 
من 18M‏ تمكنا من زيادة وتيرة أبحاثنا وتفاصيلهاء فالتحليلات التي كانت تستغرق 
أيامًا وأسابيع يمكن إنجازها الآن في دقائق, أو حتى ثوان. إن توفير التحليلات الداخلية 
سيوفر الكثير من التكاليف. فبدلًا من دفع مئات الآلاف من الدولارات إلى الباعة 
الخارجيين عندما نحتاج إلى بعض التحليل: فإنه يمكننا القيام بذلك بأنفسنا -بدقة أكثر, 
وسرعة كبيرة, وتكلفة أقل بكثير. ونحن نتوقع رؤية عائد سريع على الاستثمار. ومع 
توفر المزيد من مصادر الرؤية المحتملة والتحليلات التي أصبحت أكثر إستراتيجية لقطاع 
الأعمالء فإن النهج الداخلي هو في الواقع الطريقة الوحيدة المقبولة لأي شبكة ترغب 
حقًا في اكتساب ميزة تنافسية من بياناتها“. 
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توجه القرارات بالبيانات: 


تُظهر العديد من النتائج التي توصل إليها هذا التحليل الجديد تحولًا حقيقيًا في 
طريقة عمل ©434. فعلى سبيل المثالء نجد أن قسم ذكاء الأعمال في الشركة استطاع 
إنشاء نماذج إحصائية متطورة تساعد الشركة على تحسين إستراتيجياتها التسويقية 
واتخاذ قرارات أكثر ذكاءً بشأن مدى قوة الترويج لكل عرض. 





مجهزة | تقوم شركة :81340 بجمع بيانات 
التقييمات مع معلومات المشاهد 
من مجموعة كبيرة من القنوات 
الرقمية: خدمات الفيديو الخاصة 
بها عند الطلب وخدمات البث 
المباشر وتجار التجزئة وخدمات 
التلفاز عبر الإنترنت. 
















مترابطة | يعمل محرك البيانات والتحليلات 
الضخم والشامل على تحفيز 
البيانات وجعلها متاحة لمجموعة 
من الأدوات التحليلية الوصفية 
والتنبؤية للنمذجة السريعة والإبلاغ 
والتحليل السريع. 
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ذكية ‏ يستطيع 41٤٥‏ التنبؤ بالبرامج 
الناجحة» وكيفية ترتيبهاء والعروض 
التي يجب ol‏ تنشئهاء ومن يجب 
عليها تسويقها- مما يساعد على 
كسب جماهير جديدة في سوق 
المنافسة المتزايدة. 





















وبنظرة أكثر عمقًا على نسبة المشاهدة. فإن حملات ©4310 التسويقية المباشرة 
تحقق هي الأخرى نجاحًا أكبر. وفي أحد الأمثلة الحديثةء ساعدت التجزثة الذكية 
ونمذجتها الشبيهة الشركة في استهداف المشاهدين الجدد والحاليين بشكل فعال بحيث 
كانت معاملات الفيديو حسب الطلب في 4310 أعلى مما كان متوقعًا بخلاف ذلك. 

والجدير بالذكر أن هذه القدرة المكتشفة حدينًا للوصول إلى مشاهدين جدد والتي 
تستند إلى احتياجاتهم وتفضيلاتهم الفردية لا تعد فقط قيمة بالنسبة إلى J - AMC‏ 
إنها تتمتع أيضًا بقيمة هائلة محتملة لشركاء الإعلان في الشركة. AMC asi iuo‏ 
حاليًا على توفير الوصول إلى مجموعات البيانات وأدوات التحليل الغنية الخاصة بها 
كخدمة للمعلنين. مما يساعدهم على تحسين حملاتهم من أجل جذب جماهير أكبر من 
ذي قبل عبر القنوات الخطية والرقمية. 

ويخلص 151035 تلاتلا إلى أنه: «هكننا الآن الاستفادة من قيمة البيانات الكبيرة 
يمكننا بناء اقتراح أكثر جاذبية لكل من ال لمستهلكين وا معلنين. وإنشاء محتوى أفضل 
وتسويقه بشكل أكثر فاعلية ومساعدته على الوصول إلى جمهور أوسع من خلال أخذ 
الاستفادة الكاملة من قدراتنا متعددة القنوات». 

أسئلة للمناقشة: 

-١‏ ما هي التحديات الشائعة التي تواجهها شركات البث في الوقت الحاضر؟ وكيف 
يمكن أن تساعد التحليلات على التخفيف من هذه التحديات؟ 

۲- كيف استفادت ©4310 من التحليلات لتعزيز أداء أعمالها؟ 

- ما هي أنواع تحليلات النصوص والحلول المصغرة النصية التي طورتها شبكات 
Jas FAMC‏ كنك التفكير في استخدامات أخرى محتملة لتطبيقات استخراج النص 
في صناعة البث؟ 
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Sources: IBM Customer Case Study. Using analytics to capture new viewers, predict 
ratings and add value for advertisers in amultichannel world. http://www-03.ibm.com/ 
software/busi-nesscasestudies/us/en/corp?synkey-A023603A76220M60 (accessed 


July 2016); www.ibm.com; www.amcnetworks.com. 
بنجاح على مجموعة متنوعة من المجالات‎ NLP ويتم تطبيق معالجة اللغات الطبيعية‎ 

مجموعة واسعة من المهام عبر برامج الحاسب لمعالجة اللغة البشرية الطبيعية تلقائيًا والتي كان 

يمكن القيام بها في السابق من قبل البشر فقط. وفيما يلي بع من أكثر هذه المهام شيوعًا: 

- إجابة الأسئلة: وهي مهمة الرد التلقاني على السؤال المطروح باللغة الطبيعية؛ أي إنتاج إجابة 
لغوية عند طرح سؤال لغوي بشري. وللعثور على إجابة لسؤالء فإن برنامج الحاسب قد 
يستخدم قاعدة بيانات تم تنظيمها أو مجموعة من وثائق اللغة الطبيعية (نص أساسي مثل 
(World Wide Web‏ 

- التلخيص التلقاني: وهو إنشاء نسخة من وثيقة نصية بواسطة برنامج حاسب يحتوي على أهم 
النقاط في الوثيقة الأصلية. 

- توليد لغة طبيعية: حيث تقوم الأنظمة بتحويل المعلومات من قواعد بيانات الحاسب إلى لغة 
بشرية يمكن قراءتها. 

- فهم اللغة الطبيعية: حيث تقوم الأنظمة بتحويل عينات من اللغة البشرية إلى تمثيلات أكثر 
رسمية يسهل على برامج الحاسب التلاعب بها. 

- الترجمة الآلية: وهي الترجمة التلقائية للغة إنسانية واحدة إلى لغة أخرى. 

- قراءة اللغة الأجنبية: برنامج حاسوبي يساعد المتحدث باللغات غير الأصلية على قراءة لغة 
أجنبية مع النطق الصحيح واللهجات على أجزاء مختلفة من الكلمات. 

- الكتابة باللغة الأجنبية: برنامج حاسب يساعد المستخدم غير الأصلي في الكتابة بلغة أجنبية. 

- التعرف على الكلام: يحول الكلمات المنطوقة إلى مدخلات قابلة للقراءة آليًا. وبالنظر إلى مقطع 
صوت لشخص يتحدثء ينتج النظام إملاءً نصيًا. 

- النص إلى الكلام: يطلق أيضًا عليه تركيب الكلام» يقوم برنامج الحاسب تلقائيًا بتحويل نص 
اللغة العادية إلى خطاب إنساني. 

- تدقيق النص: يقوم برنامج الحاسب بقراءة نسخة من النص لإثبات وتصحيح أي أخطاء. 

- التعرف الضوني على الحروف: الترجمة الآلية لصور مكتوبة بخط اليد أو مطبوعة أو مطبعية 
Šole)‏ ما يتم التقاطها بواسطة ماسح ضوثي) وتحويلها إلى وثائق نصية قابلة للتحرير آليّ. 
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ويعتمد نجاح وشهرة التنقيب في النص على التقدم في معالجة اللغات الطبيعية 211.7 في كل 
جيل كما هو الحال à‏ فهم اللغات البشرية. وتتيح معالجة اللغات الطبيعية N1۴‏ استخراج 
الخصائص من النص غير المهيكل بحيث يمكن استخدام مجموعة متنوعة من تقنيات التنقيب في 
البيانات لاستخراج المعرفة (أنماط وعلاقات جديدة ومفيدة) من ذلك النص. 


أسئلة مراجعة على القسم 8-0: 

SNLP ما هي معالجة اللغات الطبيعية‎ -١ 

-Y‏ كيف ترتبط معالجة اللغات الطبيعية بالتنقيب في النصوص؟ 

-Y‏ اذكر بعض الفوائد والتحديات لمعالجة اللغات الطبيعية 211:9؟ 

؟N1۲ ما هي المهام الأكثر انتشارًا التي تتناولها معالجة اللغات الطبيعية‎ -٤ 


٥‏ تطبيقات التنقيب في النص: 

نظرًا لزيادة كمية البيانات غير المنظمة التي يتم جمعها من قبل ابمؤسسات» فإن اقتراح أدوات 
للتنقيب في النص فائقة القيمة وذات انتشار واسع تزداد أيمًّا. وتدرك العديد من المنظمات في 
الوقت الراهن أهمية استخراج المعرفة من مستودعات البيانات المستندة إلى الوثائق من خلال 
استخدام أدوات التنقيب في النص. وفيما يلي نذكر مجموعة فرعية صغيرة فقط من فئات 
التطبيقات المثالية للتنقيب في النص. 


تطبيقات التسويق: 
يمكن استخدام التنقيب في النص لزيادة البيع المتقاطع والبيع من خلال تحليل البيانات غير 
المهيكلة الناتجة عن مراكز الاتصال. كما يمكن تحليل النصوص التي تم إنشاؤها بواسطة ملاحظات 
مركز الاتصال» بالإضافة إلى نسخ المحادثات الصوتية مع العملاء من خلال خوارزميات التنقيب في 
النص لاستخراج معلومات جديدة وعملية حول تصورات العملاء تجاه منتجات وخدمات الشركة. 
وبالإضافة إلى ذلكء تعد المدونات» وملاحظات المس تخدمين للمنتجات في مواقع الويب المستقلة, 
ومنشورات لوحات المناقشة كنرًا ذهبيًا يممكن من خلاله التعرف على مشاعر العملاء؛ حيث يمكن 
استخدام هذه المجموعة الغنية من ا معلومات» بمجرد تحليلها بشكل صحيح. لزيادة رضا العميل 
والقيمة الإجمالية لمدة تعامله مع الشركة. )2008 -(Coussement & Van den Poel,‏ 
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لقد أصبحت قيمة التنقيب في النص لا تُقدر بثمن لإدارة علاقات العملاء؛ حيث يمكن 
للشركات استخدام التنقيب في النص لتحليل مجموعات غنية من البيانات النصية غير الهيكلية 
مقترنة بالبيانات المنظمة ذات الصلة المستخرجة من قواعد البيانات التنظيمية: Sax‏ بتصورات 
العملاء وسلوك الشراء اللاحق. وقد Van den Poels Coussement (j JS eS‏ )2009( 
في تطبيق التنقيب في النص بنجاح من أجل تحسين قدرة نموذج ما على التنبؤ بشكل أفضل 
باضطراب العملاء (أي تناقص العملاء) بحيث يتم تحديد العملاء الأكثر عرضة لمغادرة الشركة من 
أجل القيام بالتكتيكات اللازمة للحفاظ عليهم. 

وقد استخدم (Y- V) 05-515 Ghani‏ التنقيب في النص لتطوير نظام قادر على استنتاج 
سمات ضمنية وصريحة من المنتجات من أجل تعزيز قدرة تجار التجزئة على تحليل قواعد بيانات 
المنتجات. إن معالجة المنتجات كمجموعات من أزواج السمة والقيمة وليس ككيانات بسيطة 
يمكن أن تعزز فعالية العديد من تطبيقات الأعمالء Le‏ في ذلك التنبؤ بالطلب» وتحسين التركيب» 
بالإضافة إلى توصيات المنتجات» ومقارنة التركيب بين تجار التجزئة والمصنعين» فضلًا عن اختيار 
موردي المنتجات. ويس مح النظام المقترح للأعمال التجارية بتمثيل منتجاتها من حيث السمات 
وقيم السمات بدون جهد يدوي كبير. كما يتعلم النظام هذه السمات عن طريق تطبيق تقنيات 
التعلم تحت semisupervised doga då Slå]‏ على وصف المنتجات الموجودة في مواقع 
الويب الخاصة بتجار التجزئة. 


تطبيقات الأمان: 

ربما يكون أحد أكبر وأبرز تطبيقات التنقيب في النص في مجال الأمان نظام المراقبة 178:011131.017 
المصنف بدرجة عالية. وكما هو معروفء فإنه من المفترض أن يكون نظام 8:0111:1077 قادرًا 
على تحديد محتوى المكالات الهاتفية والفاكسات والبريد الإلكتروني وأنواع أخرى من البيانات» 
بالإضافة إلى اعتراض المعلومات المرسلة عبر الأقمار الصناعية» وشبكات الهاتف العمومية التبديلية, 
وروابط الميكروويف. 

وفي EUROPOL Cal Y+ -V ale‏ بتطوير نظام متكامل يمكنه الوصول إلى كميات هائلة من 
مصادر البيانات المهيكلة وغير المهيكلة» وتخزينها وتحليلها لتتبع الجرهة امنظمة عايًا. ويطلق على 
نظام التحليل الشامل لدعم أجهزة الذكاء اسم نظام (04515)»: ويهدف هذا النظام إلى دمج أحدث 
تقنيات التنقيب في البيانات والنص المتوفرة في السوق في الوقت الحالي. وقد مكن نظام :781110501 
من إحراز تقدم كبير في دعم أهداف تطبيق القانون على المستوى الدولي (2007 ,81012020[1). 
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ويقوم كل من مكتب التحقيقات الفيدرالي الأمريكي (581) ووكالة CIA) 55,4 Colts]‏ 
تحت إشراف وزارة الأمن الوطني» بتطوير نظام للبيانات العملاقة والنصوص. ومن المتوقع أن 
يُنشَئ النظام مستودع بيانات ضخم إلى جانب مجموعة متنوعة من وحدات البيانات والتنقيب 
في النص لتلبية احتياجات اكتشاف اللعرفة لوكالات تطبيق القانون الفيدرالية والولاثية والمحلية. 
وقد كان لكل من مكتب التحقيقات الفيدرالي ووكالة المخابرات المركزية قبل هذا المشروع قاعدة 
بيانات منفصلة خاصة بهاء مع القليل من الترابط أو حتى بدونه. 

وهناك تطبيق آخر من تطبيقات التنقيب في النصوص, هذا التطبيق في مجال كشف الخداع» 
وهو تطبيق التنقيب في النص على مجموعة كبيرة من التصريحات الإجرامية في العام الحقيقي 
(شخصية الفائدة)» وقد وضع كل من Birosg Fuller‏ ومعاء<1 (2008) نماذج التنبؤ لتمييز 
البيانات الكاذبة من البيانات الصادقة. وباستخدام مجموعة غنية من الإشارات المستخلصة من 
البيانات النصية» يتنبأ النموذج بعينات الدقة بنسبة ۷١‏ والتي يعتقد أنها نجاح كبير مع الأخذ في 
الاعتبار أن الإشارات يتم استخلاصها فقط من البيانات النصية (لا توجد إشارات شفوية أو بصرية). 
علاوةٌ على ذلكء فبالمقارنة مع تقنيات كشف الخداع الأخرى» مثل جهاز كشف الكذب» فإن هذه 
الطريقة غير متداخلة وقابلة للتطبيق على نطاق واسع ليس فقط للبيانات النصية» ولكن أيضًا 
(محتمل) إلى نسخ التسجيلات الصوتية. ويرد وصف أكثر تفصيلًا للكشف عن الخداع القائم على 
النص في الحالة العملية 8-0. 


حالة عملية ٠-٥‏ 
التنقيب للكشف عن الأكاذيب 


تواصل الاتصالات المبرمجة تقدمها مدفوعة بالتطورات في تقنيات المعلومات على شبكة 
الإنترنت وزيادة العوممة لتتحول إلى الحياة اليومية. حاملة معها أساليب جديدة للخداع. 
فنجد أن هناك تزايدًا سريعًا في حجم الدردشة النصية» والرسائل الفورية» والرسائل النصية, 
بالإضافة إلى النص الذي تولده مجتمعات الإنترنت. بل حتى البريد الإلكتروني هو أيضًا 
مستمر في تزايد استخدامه. ومع النمو الهائل في التواصل القائم على النصوص. ازدادت 
إمكانات الناس لخداع الآخرين من خلال التواصل المحوسب. مما قد يؤدي إلى نتائج كارثية. 

ولسوء الحظء فإن البشر بشكلٍ عامء يميلون إلى التكاسل وعدم بذل الجهد في مهام 
كشف الخداع» وتتفاقم هذه الظاهرة في الاتصالات القائمة على النص. وقد شمل جزء 
كبير من البحث عن كشف الخداع (المعروف أيضًا بتقييم المصداقية) في الاجتماعات 
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والمقابلات الشخصية المباشرة. ومع ذلكء ومع نمو الاتصالات القائمة على النصوصء فإن 
تقنيات الكشف عن الخداع المستندة إلى النصوص تعد ضرورية. 

وهناك تقنيات للكشف عن الخداع بنجاح. وقد حظيت هذه التقنيات بقابلية 
تطبيقها على نطاق واسع؛ حيث يكن لتطبيق القانون استخدام أدوات وتقنيات دعم 
القرار للتحقيق في الجرائم» وإجراء الفحص الأمني في المطارات. ومراقبة اتصالات 
الإرهابيين المشتبه بهم. وقد يستخدم المتخصصون ف الموارد البشرية أدوات كشف 
الخداع لفحص المتقدمين. فهذه الأدوات والتقنيات لديها أيضًا القدرة على فحص رسائل 
البريد الإلكتروني للكشف عن الاحتيال أو غيرها من الأفعال الخاطئة التي ارتكبها ضباط 
الشركات. وعلى الرغم من أن بعض الناس يعتقدون أنهم يستطيعون التعرف بسهولة 
على أولئك الذين ليسوا صادقينء إلا أن ملخضًا لأبحاث الخداع أظهر أن متوسط نسبة 
الأشخاص الذين يدققون في اتخاذ قرارات صائبة هي 0£ )2006 «(Bond & DePaulo,‏ 
وقد يكون هذا الرقم في الواقع أسوأ عندما يحاول البشر اكتشاف الخداع في النص. 

وباستخدام مجموعة من تقنيات التنقيب في النص والتنقيب في البيانات» قام كل من 
۴۲ وآخرون (۸١١۲م)‏ بتحليل البيانات الشخصية التي استغلها أشخاص متورطون 
في جرائم في قواعد عسكرية؛ حيث يُطلب من المشتبه بهم والشهود في هذه البيانات 
كتابة ما يتذكرونه من الحدث بكلماتهم الخاصة. وقد قام الموظفون المكلفون بتنفيذ 
القانون العسكري بتفتيش البيانات الأرشيفية للإدلاء بتصريحات يمكن أن يحددوها 
بشكل قاطع بأنها صادقة أو خادعة. وقد اتُخذت هذه القرارات على أساس الأدلة 
الموثقة وحالة القضية. وبعد أن يتم تصنيفهم كصادقين أو مخادعينء يقوم الموظفون 
المكلفون بتنفيذ القانون بإزالة معلومات تحديد الهوية ويقدمون البيانات إلى فريق 
البحث. وفي المجموع. تم تلقي 2/١‏ بيانًا قابا للاستخدام للتحليل. وقد اعتمدت 
طريقة الكشف عن الخداع المبنية على النص التي استخدمها «(ev * -A) 0551s Fuller‏ 
على عملية تُعرف باسم التنقيب في خاصية الرسائل والتي تعتمد على عناصر البيانات 
وتقنيات التنقيب في النص. ويعرض الشكل (0-") وصفًا مبسطًا للعملية. 

sl‏ أعد الباحثون البيانات للمراجعة» حيث يجب أن يتم نسخ البيانات الأصلية 
المكتوبة بخط اليد في ملف معالجة النصوص. ثانيّاء تم تحديد السمات (مثل: 
الإشارات)» حيث قام الباحثون بتحديد ١‏ سمة تمثل فئات أو أنواعًا من اللغة مستقلة 
نسبيًا عن محتوى النص ويمكن تحليلها بسهولة عن طريق وسائل آلية. فعلى سبيل 
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EE 


المثالء يمكن تعريف ضمير الشخص الأولء مثل: أنا أو لي دون تحليل للنص المحيط. 
ويسرد الجدول )١5(‏ الفئات وقائمة أمثلة بالخصائص المستخدمة في هذه الدراسة. 


في ملف ثابت لزيد من 


وقد تم استخراج الميزات من البيانات النصية وإدخالها 


المعالجة. وياستخدام العديد من طرق اختيار الخصائص بالإضافة إلى التحقق المتقاطع 
من ٠١‏ أضعافء قارن الباحثون دقة التنبؤ بثلاث طرق شائعة للتنقيب في البيانات. وقد 
أشارت النتائج إلى أن نماذج الشبكات العصبية كانت صاحبة الأداء الأفضل بنسبة دقة 
تنبؤية بلغت ۷۳,١١‏ على عينات بيانات الاختبار. وجاءت أشجار القرار في المركز الثاني 


بنسبة 10,۲۸ ⁄. 





بنسبة 001,7 في حين حل في المركز الأخير الانحدار اللوجستي 


وتشير النتائج إلى أن الكشف التلقائي عن الخداع المبني على النص لديه القدرة على 


بنجاح على بيانات العام 
كشف الخداع الأخرى» 


مساعدة المكلفين بهذه المهمةء ويمكن تطبيق هذه الطريقة 
الحقيقي. وقد تجاوزت دقة هذه التقنيات دقة معظم تقنيات 
وذلك على الرغم من أنها كانت تقتصر على الإشارات النصية. 














دلالات مستخرجة 




















النص 


JS‏ ه-8: عملية كشف الخداع القائمة على 
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جدول :١-0‏ فئات وأمثلة من الميزات اللغوية المستخدمة في كشف الخداع 









































e‏ الفئة إشارات المثال 
۱ الكمية عدد الأفعال» عدد عبارات الأسماء إلخ 
Y‏ التعقيد متوسط عدد الجمل ومتوسط طول الجملة وما إلى ذلك 
٠"‏ | عدم اليقين (الشك) Hlib Jl Jis coal‏ 
ع | عدم الفورية الصوت المنفعل, والتصنيفء وما إلى ذلك 
|o‏ التعبيرية Emotiveness‏ 
1 التنوع التنوع المعقولء التكرارء إلخ 
۷ الغير رسمية نسبة الأخطاء المطبعية 
|A‏ الخصوصية |المعلومات الزمانية AILL‏ وا معلومات الإدراكيةء وما إلى ذلك 
Su ٩‏ تأثير إيجابي وتأثير سلبيء إلخ 
أسئلة للمناقشة: 


-١‏ اذا يصعب كشف الخداع؟ 

àS -Y‏ يمكن استخدام التنقيب à‏ النص / البيانات للكشف عن الخداع à‏ النص؟ 

*- ماهي التحديات الرئيسة في رأيك لمثل هذا النظام الآلي؟ 
Sources: Fuller, C. M., Biros, D., & Delen, D. (2008). Exploration of feature‏ 
selection and advanced classification models for high-stakes deception detection.‏ 
Proceedings of the 41st Annual Hawaii International Conference on System‏ 
Sciences (HICSS), Big Island, HI: IEEE Press, 8099-; Bond C. E, & DePaulo, B.‏ 


M. (2006). Accuracy of deception judgments. Personality and Social Psychology 
Reports, 10(3), 214234-. 


التطبيقات الطبية الحيوية: 
يحمل التنقيب في النص إمكانات كبيرة للمجال الطبي بشكل عام والطب الحيوي على وجه 


الخصوصء وذلك لعدة أسباب. أولاه التوسع ف الأدبيات (المواد المطبوعة) والمنشورات المنشورة 
(خاصة مع ظهور المجلات المفتوحة المصدر) في الميدان بمعدل أسي. ثانيّاء بالمقارنة مع معظم 
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المجالات الأخرىء فإن الأدبيات (المواد المطبوعة) الطبية هي أكثر توحيدًا وتنظيمًاء مما يجعلها 
مصدر معلومات ”أكتر ملاءمة“. وأخيراء تكون ال مصطلحات المستخدمة في هذا الكتاب ثابتة deua‏ 
مع وجود (علم الوجود) 92601087 الموحد إلى حد ما. وفيما يلي بعض الدراسات النموذجية حيث 
تم استخدام تقنيات التنقيب في النص بنجاح في استخراج أنماط جديدة من الأدب الطبي الحيوي. 

إن التقنيات التجريبية مثل تحليل الحمض النووي المجهري (1(2818)»: والتحليل المتسلسل 
(SAGE) giad ghh‏ ومجموعة spectrometry proteomics‏ وغيرهاء تولد كميات كبيرة 
من البيانات المتعلقة بالجينات والبروتينات. وكما هو الحال في أي نهج تجريبي آخرء فمن 
الضروري تحليل هذا الكم الهائل من البيانات في سياق المعلومات المعروفة سابقًا حول الكيانات 
البيولوجية قيد الدراسة. وتعتبر الأدبيات مصدرًا قيمًا للغاية للمعلومات للتحقق من صحة 
التجارب وتفسيرها. ولذلك؟ فإن تطوير أدوات التنقيب الآلي عن النصوص للمساعدة في مثل هذا 
التفسير هو أحد التحديات الرئيسية في أبحاث المعلوماتية الحيوية الحالية. 

إن معرفة موقع البروتين داخل الخلية يمكنه أن يساعد على توضيح دور تلك الخلية في 
العمليات الحيوية وتحديد إمكاناتها كهدف دوائي. وقد تم وصف العديد من أنظمة تحديد 
الموقع في الأدبيات؛ حيث يركز البعض على كائنات معينة» في حين يحاول البعض الآخر تحليل 
مجموعة واسعة من الكائنات الحية. وقد )38 Shatkay c-‏ 5,15 (/1١٠٠٠م)‏ نظامًا شاملًا يستخدم 
عدة أنواع من السمات المتسلسلة والنصية للتنبؤ بموقع البروتينات. ويكمن التجديد الرئيس 
لنظامهم في الطريقة التي يتم بها اختيار مصادر النص وميزاته ودمجها مع ميزات متسلسلة. وقد 
قاموا باختبار النظام على مجموعات البيانات المستخدمة سابقًا وعلى مجموعات بيانات جديدة 
وضعت خصيصًا لاختبار قوتها التنبؤيةء حيث أظهرت النتائج أن نظامهم يتغلب باستمرار على 
النتائج التي تم الإبلاغ عنها مسبقًا. 

Chun La‏ وآخرون (5١٠٠٠م)‏ فقد قاموا بوصف نظام يس تخرج علاقات الجين المرضي من 
الأدبيات التي يتم الوصول إليها عبر 2/1:101.1215 حيث قاموا ببناء قاموس لأسماء الأمراض 
والجينات من ست قواعد بيانات عامة واستخرجوا العلاقة بين المرشحين عن طريق مطابقة 
القاموس. ونظرًا لأن مطابقة القاموس تنتج عددًا كبيرَا من النتائج الإيجابية لكنها غير صحيحة 
فقد طوّروا طريقة للتعرّف على الكيان القائم على تعلم الآلة المسمى بكيان التعرف (NER)‏ 
لتصفية التقديرات الخاطئة لأسماء الأمراض / الجينات. ووجد الباحثون أن نجاح استخلاص 
العلاقة يعتمد بشكل كبير على أداء تصفية 711:12 وأن التصفية حسّنت دقة اس تخلاص العلاقة 
بنسبة ۲,۷ على تكلفة انخفاض صغير في إعادة الاتصال. 
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ويبين الشكل (6-0) صورة مبسطة لعملية تحليل نص متعدد المستويات لاكتشاف العلاقات 
بين الجينات والبروتينات (أو تفاعلات البروتينات والبروتينات) في الأدبيات الطبية الحيوية 
(23107 وآخرونء .)7٠١0‏ وكما يتبين في هذا المثال المبسط الذي يس تخدم جملة بسيطة من 
النص الطبي الحيويء حيث يتم أولا ف اللعنويات الثلاثة السفلية) ترميز النص باستخدام جزء 
من الكلام مع قليل من التعديلء ثم تتم مطابقة المصطلحات (الكلمات) الرمزية (وتفسيرها) 
مقابل التمثيل الهرمي لنطاق علم a‏ لاشتقاق العلاقة بين الجين والبروتين. إن تطبيق هذه 
الطريقة (و / أو بعض اختلافاتها) على الأدبيات الطبية الحيوية يوفر إمكانات كبيرة لفك شفرة 
-Human Genome g 5 a à cladis‏ 
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شكل 5-»: تحليل متعدد المستويات للنص لتحديد تفاعل الجين/ البروتين 

التطبيقات الأكاديمية: 

تحظى مسألة التنقيب في النص بأهمية كبيرة بين الناشرين الذين لديهم قواعد بيانات كبيرة 
من المعلومات التي تتطلب فهرسة لاسترجاعها بشكل أفضل. وهذا صحيح بشكل خاص في 
التخصصات العلمية, والتي غالبًا ما تكون معلومات محددة للغاية يتضمنها النص المكتوب. وقد 
تم إطلاق مبادرات» مثل: اقتراح الطبيعة لواجهة التنقيب في النص ee‏ والتعريف الشائع 
لنوع وثيقة نشر المعاهد الوطنية للصحة. والتي من شأنها أن توفر مؤشرات دلالية آلية للإجابة 
عن استفسارات محددة موجودة في النص دون إزالة حواجز الناشر للوصول إلى الجمهور. 
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كما أطلقت المؤسسات الأكاديمية مبادرات التنقيب في النص. فنجد على سبيل المثال أن المركز 
الوطني للتنقيب في النص - وهو جهد تعاوني بين جامعتي مانشستر وليفر بول - يوفر أدوات 
مخصصة» ومرافق بحثء ومشورة حول التنقيب في النص للمجتمع الأكادهميء مع التركيز ule das‏ 
التنقيب على النص في العلوم البيولوجية والطبية الحيوية» وقد توسعت الأبحاث منذ ذلك الحين في 
العلوم الاجتماعية. وفي الولايات المتحدة, تقوم كلية الإعلام في جامعة كاليفورنياء بيركليء بتطوير 
برنامج يدعى 0101656 لمساعدة الباحثين في العلوم البيولوجية في التنقيب في النصوص وتحليلها. 

وكما هو موضح في هذا القسم. فإن التنقيب في النص يحتوي على مجموعة متنوعة من التطبيقات 
في عدد من التخصصات المختلفة. انظر الحالة العملية (6-0) للاطلاع على مثال لكيفية استخدام الشركة 
الرائدة في تصنيع منتجات الحوسبة في معالجة النصوص؛ من أجل فهم احتياجات ورغبات العملاء 
الحاليين والمحتملين المتعلقة بجودة المنتج وتصميم المنتج بشكل أفضل. 


حالة عملية 0-€ 
إدراج العميل ضمن معادلة الجودة: تستخدم لينوفو Qo Malos! Lenovo‏ أجل 
إعادة التفكير في إعادة تصميمها 

كانت لينوفو 1.60070 تقترب من التصميم النهائي لتحديث تخطيط لوحة المفاتيح 
لأحد أشهر أجهزة الحاسب الخاصة بها عندما رصدت مجتمعًا صغيرًا من اللاعبين على 
الإنترنت. غير أنه يعتبر مجتمعًا مهمًا وكبيرء يدعم تصميم لوحة امفاتيح الحالي. وقد 
gol‏ هذا التغيير في التصميم إلى تمرد جماعي لقطاع كبير من قاعدة عملاء لينوفو - 
المطورين المستقلين واللاعبين. 

وقد كانت وحدة تحليلات الشركات تستخدم 545 كجزء من مشروع الجودة 
الجوهرية. وبتتبع الويب. وغربلة البيانات النصية التي تشير إلى لينوفو. كشف التحليل 
عن منتدى لم يكن معروقًا من قبل, أن أحد العملاء الحاليين كتب مراجعة متألقة من 
ست صفحات للتصميم الحالي» خاصة لوحة المفاتيح. وقد جذب هذا الاستعراض ٠٠٠٠١‏ 
تعليق! يقول :VOC Analytics ءژlaعلl Jalos Aa Mohammed Ch 22a‏ ”¢ 
يكن الأمر شيئًا وقد وجدناه في المراجعات التقليدية لتصميم ما قبل الإنتاج“. 

وقد كان هذا النوع من الاكتشافات الذي عزز التزامات الشركة لنظام لينوفو 
للكشف اممبكر (1۴2)ء وعمل 023818 وفريق تحليلات الشركات الخاص به. 
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مم تنطلق شركة لينوفوء أكبر شركة لأجهزة الحاسب الشخصية والأجهزة اللوحية على 
مستوى العام» لقياس مشاعر المدونين الغامضين أو اكتشاف المنتديات الجديدة. أرادت 
الشركة إحراز الجودة وتطوير وابتكار المنتجات من خلال دراسة البيانات -الخاصة بها 
ومن خارج الجدران الأربعة. يقول 053278: ”نحن نركز بشكل رئيسي على تحسين 
سلسلة التوريدء وفرص البيع / بيع منتج عن طريق إقناع الزبون» والتسعير والتعبئة 
للخدمات. وأي تحسينات نجريها في هذه المجالات تستند إلى الاستماع إلى العميل“. 
وتوفر 545 الإطار ”لإدارة كمية البيانات المجنونة“ التي يتم إنشاؤها. 

وقد انتشر نجاح المشروع كالنار في الهشيم داخل ال منظمة. حيث خططت لينوفو 
في البداية لنحو ١10‏ مستخدماء ولكن شغهيًا وصلت إلى ٠٠٠١‏ مستخدم قاموا بتسجيل 
الدخول إلى لوحة المعلومات (1.51 لعرض مرق حول معنويات العملاء والضمانء 
وتحليل مركز الاتصال. 

وكانت النتائج مذهلة: 
- تخفيض أكثر من a X0*‏ وقت اكتشاف المشكلة. 
- تخفيض بنسبة من *٠١‏ إلى 10* في تكاليف الضمان من العيوب الخارجة عن الطبيعي. 
- تخفيض بنسبة من 2٠١‏ إلى “0٠‏ في مكالمات مركز الاتصال للمعلومات العامة. 
النظر إلى الصورة الكبيرة: 
تتميز الطرق التقليدية لقياس المشاعر وجودة الفهم بنقاط الضعف والتأخر الزمني: 
- تعرض استطلاعات العملاء معلومات فقط من العملاء الراغبين في ذلك. 
db ls Ulli -‏ معلومات الضمان بعد أشهر من تسليم المنتج الجديد. 
- قد يكون من الصعب فك شفرة الكثير من الأسباب لسخط العملاء ومشكلات المنتج. 

وبالإضافة إلى ذلك تتبع لينوفو منتجها وتعبئته ببرامج لا تنتجهاء ويستخدم العملاء 
مجموعة متنوعة من ا ملحقات (محطات الإرساء وأجهزة الماوس) التي قد تكون أولا 
تكون منتجات لينوفو. ولزيادة المشكلة. تعمل الشركة في ١50‏ دولة وتدعم أكثر من 
٠‏ لغةء لذلك كانت الطرق اليدوية لتقييم التعليق متعارضة» واستغرقت الكثير من 
الوقتء وم يكن بمقدورها التوسع في حجم التعليقات التي كانت تراها في وسائل 
التواصل الاجتماعي. ويجب أن يكون تحليل المشاعر قادرًا على إدراك الفروق الدقيقة 
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التحليلات التنبؤية (؟): تحليلات النص والويب ووسائل التواصل الاجتماعي 


في اللغات المحلية. (على سبيل المثالء طريقة وصف الأستراليين للأشياء تختلف عن 
طريقة وصف الأمريكان). 

وقد وفر الاكتشاف القائم على التحليل لمشكلة في محطات قاعدة الشحن ثاني فوز 
كبير لمبادرة 1۴ الخاصة ب 0۷0٠ء1‏ حيث كان العملاء يتصلون بالدعم الفني ليقولوا 
إنهم يواجهون مشاكل في الشاشة» أو أن الجهاز مغلق بشكل مفاجئ أو أن البطارية لا 
تشحن. وقد ظهرت حسابات مماثلة على مواقع وسائل التواصل الاجتماعي. في بعض 
الأحيان. ولكن ليس داتماه ذكر العميل لإرساء السفن ع«i)ءهك.‏ م يكن الأمر كذلك قبل 
أن تستخدم لينوفو 545 لتحليل مجموعة مكؤنات مراكز الاتصال ومشاركات وسائل 
التواصل الاجتماعي التي ربطت كلمة إرساء عكك 400 بالمشكلة. مما ساعد مهندسي 
الجودة على معرفة السبب الجذري وإصدار تحديث للبرنامج. 

يقول 08858: ”لقد تمكنا من جمع هذه التعليقات في غضون أسابيع: وكانت 
تستغرق من ٠١‏ إلى ٠١‏ يومًا لأننا اضطررنا إلى انتظار عودة التقارير من الميدان”. والآن 
يستغرق الأمر من 10 إلى ٠٠١‏ يومًا فقط. وقد أدى هذا الانخفاض في وقت الاكتشاف 
إلى انخفاض بنسبة ١٠خ‏ إلى 10* في تكاليف الضمان لهذه المشكلات. والتي تبلغ حوالي 
١‏ مليار دولار سنويًا. وهذه توفيرات كبيرة. 

وعلى الرغم من أن معلومات مركز الاتصال كانت حاسمة» إلا أن مكون وسائل 
التواصل الاجتماعي هو ما أغلق الصفقة. يقول ه02: ”مع تويتر وفيسبوك. وصف 
الناس ما كانوا يفعلونه في تلك اللحظة قائلين: لقد استقرت الآلة وحدث XX‏ إنها 
خامدة وغير متحيزة وقوية للغاية“. 

وقد تم العثور على فكرة غير متوقعة عند تحليل ما يقوله العملاء أثناء تشغيل 
أجهزة الحاسب الشخصية الخاصة بهم. كما أدركت لينوفو أن وثائقها لشرح منتجاتهاء 
والضمانات» وما شابه لم يكن la” Chaara JLS Bils‏ تكلفة لكل مكامة مركز 
الاتصال. وبفضل الوثائق المحسنة. شهدنا انخفاصًا بنسبة من <٠١‏ إلى 40٠‏ في المكامات 
الواردة للحصول على معلومات عامة“. 

الإشادة بالفوز وراء الخطوط الأمامية: 


كان المشروع ناجحًا جدًا لدرجة أن .CEO Je 42s Chaara‏ والهدف هو تكوين عرض 
لوحة معلومات ). Jai; .C-suite‏ 08382: ”هذا هو مستوى التفكير من كبار التنفيذيين 
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لديناء فهم يؤمنون بهذا. وبالإضافة إلى ذلكء ستقوم مجموعة 03858 بقياس نجاح هذا 
الجهد بشكل رسمي وتوسيعه لقياس قضايا مثل تجربة العملاء عند “Lenovo gis slå‏ 

وقد أدى تطبيق التحليلات في نهاية المطاف إلى فهم أكثر شمولية لمفهوم الجودة. 
فالجودة ليست مجرد جهاز حاسب يعمل بشكل صحيح. ولكنها تعني معرفة الناس 
كيفية استخدامه» والحصول على مساعدة سريعة ودقيقة من الشركة. والحصول على 
مكونات غير تابعة لشركة لينوفو للعمل بشكل جيد مع الأجهزة» وفهم ما يعجب العملاء 
بشأن المنتج الحالي -بدلًا من إعادة تصميمه فقط لآن مصممي المنتجات يعتقدون أنها 
الثيء الصحيح الذي ينبغي القيام به. يقول 088218: ”لقد سمحت لنا 545 بالحصول 
على تعريف للجودة من وجهة نظر العميل“. 

أسئلة للمناقشة: 

-١‏ كيف استخدمت لينوفو تحليلات النصوص والتنقيب في النص لتحسين جودة 
وتصميم منتجاتها وفي النهاية تحسين رضا العملاء؟ 

۲- ما هي التحديات والحل المقترح والنتائج التي تم الحصول عليها؟ 
المصادر: ”إحضار العميل إلى معادلة الجوة (SAS? Visual Analytics, SAS° Contextual‏ 
Jules - Analysis, SAS* Sentiment Analysis, SAS* Text Miner)‏ المشاعر والتحليلات المتقدمة 
تساعد لينوفو على تحديد مشكلات الجودة ورغبات العملاء بشكل أفضل“. 2016 © غطعاءتردره© 
Inc., Cary, NC, USA‏ عأناءناده1 545. أعيد طبعها بإذن. كل الحقوق محفوظة. 


أستلة مراجعة على القسم 4-0: 

-١‏ اذكر وناقش باختصار بعضًّا من تطبيقات التنقيب في النص في مجال التسويق. 
'- كيف يمكن استخدام التنقيب في النص في الأمن ومكافحة الإرهاب؟ 

*- ما هي بعض تطبيقات التنقيب الواعدة في النص في مجال الطب الحيوي؟ 


0-5 عملية التنقيب في النص: 


لكي تنجح دراسات تحليل النصء فلابد أن تتبع منهجية سليمة تستند إلى أفضل الممارسات. 
حيث يلزم وجود نموذج عملية موحدة مماثل للعملية القياسية للتنقيب ف البيانات الصناعية 
silg (CRISP-DM)‏ يُعد معيار الصناعة لمشاريع التنقيب في البيانات (انظر الفصل 6). وعلى 
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الرغم من أن معظم أجزاء åL CRISP-DM‏ للتطبيق أيصًا في مشروعات التنقيب في النص» فإن 
النموذج المحدد لعملية التنقيب في النص سيشمل أنشطة أكثر تفصيلًا للعالجة البيانات. ويصور 
الشكل (0-0) مخططًا سياقيًا عالي المستوى لعملية التنقيب في النص النموذجية (80 معاء2 
(Crossland, 2008‏ حيث يعرض الرسم التخطيطي لهذا السياق نطاق العمليةء مع التأكيد على 
واجهاتها مع البيئة الأكبر. وأما في جوهره, فإنه يرسم حدودًا حول العملية المحددة لتحديد ما 
يتم إدراجه في (وما يتم استبعاده من) عملية استخراج النص بشكل واضح. 
حدود البرمجيات الاجهزة 

قضايا الخصوصية .د( 
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بيانات غير مهيكلة 
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المعرفة المتعلقة بالسياق 











شكل ه-0: مخطط السياق لعملية التنقيب في النص 

وكما يشير الرسم البياني للسياقء فإن المدخلات (الاتصال الداخلي إلى الحافة اليسرى من ا مربع) 

في عملية اكتشاف المعرفة المستندة إلى النص هي البيانات غير المهيكلة وكذلك المهيكلة التي تجمع 
وتخزن للعملية. والناتج (الامتداد الخارجي من الحافة اليمنى للمربع) من العملية هو المعرفة 
المحددة للسياق والتي يمكن استخدامها لصنع القرار. وتتضمن عناصر التحكم» التي تسمى أيضًا 
القيود (الاتصال الداخلي إلى الحافة العلوية للمربع)» العملية الخاصة بالحدود من البرامج والأجهزة, 
ومشكلات الخصوصية: والصعوبات المتعلقة بمعالجة النص المقدم بلغة طبيعية. أما الآليات فتشمل 
(الاتصال الداخلي على الحافة السفلية للمربع) الخاصة بالعملية على التقنيات المناسبة وأدوات 
البرامج وخبرات المجال. والغرض الأساسي من التنقيب في النص (ضمن سياق اكتشاف المعرفة) هو 
معالجة البيانات غير النصية (مع البيانات aliit‏ إذا كانت ذات صلة بالمشكلة التي يتم تناولها 
والمتاحة) لاستخراج نماذج ذات معنى وقابلة للتطبيق من أجل اتخاذ قرارات أفضل. 
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الفصل الخامس 


ويمكن تقسيم عملية التنقيب في النص ذات المستوى العالي جدًا إلى ثلاث مهام dius‏ لكل 
منها مدخلات محددة لإنتاج نواتج معينة (انظر الشكل 1-6). فإذا لم يوافق ناتج المهمة ما هو 
متوقع, لأي سببء فلا بد من الرجوع لتنفيذ المهمة السابقة. 
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شكل 5-0: عملية التنقيب في النص ثلاثية الخطوات والمهام 


المهمة :١‏ تأسيس الجزء الأساسي: 

ويتمثل الغرض الرئيس من نشاط المهمة الأول في جمع كل الوثائق المتعلقة بالسياق (مجال 
الاهتمام) الذي تتم دراسته. وقد تتضمن هذه المجموعة الوثائق النصية وملفات ,73/11 ورسائل 
البريد الإلكتروني وصفحات الويب والملاحظات القصيرة. بالإضافة إلى البيانات النصية المتوفرة 
بسهولة» ويمكن أيضًا تسجيل التسجيلات الصوتية باستخدام خوارزميات التعرف على الكلام 
وجعلها جزءًا من مجموعة النصوص. 

وبمجرد تجميعهاء يتم تحويل الوثائق النصية وتنظيمها بطريقة تجعلها كلها في نفس الشكل 
التمثيلي (مثل الملفات النصية 45011) لمعالجة الحاسب. ويمكن أن تكون عملية تنظيم الوثائق 
بسيطة مثل مجموعة من مقتطفات النصوص الرقمية المخزنة في مجلد ملفء أو يمكن أن تكون 
مجموعة من الروابط لمجموعة من صفحات الويب في مجال معين. كما يمكن أن تقبل العديد من 
أدوات برامج التنقيب في النص المتاحة تجاريًا كمدخلات وتحويلها إلى ملف مسطح للمعالجة. 
وبدلا من ذلك فإنه من الممكن إعداد الملف المسطح خارج برنامج استخراج النص ثم تقديمه 
كمدخل إلى تطبيق استخراج النص. 


المهمة ۲: تأسيس مصفوفة :Term-Document‏ 


وفي هذه المهمةء يتم استخدام الوثائق الرقمية واطمنظمة (المجموعة) لإنشاء مصفوفة (-تمع1' 
À Ssa Lë > Document (TDM‏ الوثائق. أما الأعمدة فتمثل المصطلحات. 
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التحليلات التنبؤية (؟): تحليلات النص والويب ووسائل التواصل الاجتماعي 


وتتميز العلاقات بين الشروط والوثائق بمؤشرات (أي: مقياس علائقي يمكن أن يكون بسيطًا مثل 
عدد مرات حدوث المصطلح في الوثائق ذات الصلة). ويُعد الشكل (0-/) مثالًا نموذجيًا على TDM‏ 
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شكل :۷-٥‏ المصفوفة البسيطة Term-Docu ment‏ 
ويتمشل الهدف منها في تحويل LEB‏ الوثائق المهيكلة (المجموعة) إلى 11001 حيث يتم تعبئة 
الخلايا بالمؤشرات الأكثر ملاءمة. أما الافتراض فه و أنه يمكن تمثيل جوهر الوثيقة بقائمة وتكرار 
المصطلحات المستخدمة في تلك الوثيقة. ومع ذلك فهل جميع ال مصطلحات مهمة عند توصيف 
الوثائق؟ والواضح أن الإجابة هي «لا». فبعض المصطلحات. مثل: المقالات والأفعال المساعدة 
والمصطلحات المستخدمة في جميع الوثائق في ا مجموعةء ليس لها أي اختلاف في القوة, وبالتالي يجب 
استبعادها من عملية الفهرسة. وتُعد هذه القائمة من المصطلحات. والتي يُطلق عليها عادةً مصطلح 
”شروط التوقف“ أو ”كلمات التوقف“ خاصة جال الدراسة ويجب تحديدها بواسطة خبراء المجال. 
ومن ناحية أخرىء فإن المرء قد يختار مجموعة من المصطلحات المحددة سلفًا والتي بموجبها يتم 
فهرسة الوثائق (وتسمى هذه القائمة من المصطلحات بشكل ملائم مصطلحات أو قاموس). بالإضافة 
«elis I‏ فإنه من الممكن أيضًّا توفير المرادفات (أزواج المصطلحات التي سيتم التعامل معها بنفس 
الطريقة) والعبارات المحددة (مثل ”برج إيفل”) بحيث تكون مدخلات الفهرس أكثر دقة. 
ومن عمليات الترشيح الأخرى التي ينبغي إجراؤها لإنشاء هذه المؤشرات بدقة» ما يشير 
إلى إرجاع الكلمات إلى جذوره ا بحيث يتم, على سبيل المثال تحديد أشكال نحوية مختلفة 
أو انحرافات للفعل وفهرستها على أنها الكلمة نفسها. فعلى سبيل المثالء سوف يضمن النهج 
التشغيلي أن يكون التشكيل والتصميم معروفًا على غرار نموذج الكلمة. 
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ويتضمن الجيل الأول من 121 جميع المصطلحات الفريدة التي تم تحديدها في ا مجموعة 
(كأعمدة لها)» باستثناء تلك الموج ودة في قائمة التوقف؛ بالإضافة إلى جميع الوثائق (كصفوفها» 
وعدد التكرارات لكل مصطلح لكل وثيقة (كقيم الخلية الخاصة بها). وكما هو شائع» فإن المجموعة 
إذا تضمنت عددًا ys uS‏ الوثائق» فهناك فرصة جيدة جدًا لأن يتضمن نموذج 11141 عددًا كبيرا 
a kiy‏ المصطلحات. وقد تستغرق معالجة مثل هذه المصفوفة الكبيرة وقنًّا طويلاء والأهم من 
ذلكء أنها قد تؤدي إلى استخراج أنماط غير دقيقة. وعند هذه النقطة يتعين على المرء أن يقرر ما يلي: 
)١(‏ ما هو أفضل تمثيل للمؤشرات؟ و(؟) كيف هكننا تقليل أبعاد هذه المصفوفة إلى حجم معقول؟ 

تمثيل المؤشرات: بمجرد أن تتم فهرسة وثائق الإدخال وتحويل ترددات الكلمة الأؤلية (حسب 
الوثيقة)» فإنه يمكن إجراء عدد من التحويلات الإضافية لتلخيص وتجميع ال معلومات المستخرجة. 
وتعكس ترددات المصادر الخام عمومًا مدى بروز أو أهمية الكلمة في كل وثيقة. وبوجه «ol‏ 
فإن الكلمات ذات التكرار الأكبر في الوثيقة هي واصفات أفضل لمحتويات تلك الوثيقة. ومع 
ذلك فمن غير المعقول أن نفترض أن الكلمة تعد نفسها مناسبة مع أهميتها كواصفات للوثائق. 
فمثلاء إذا حدثت كلمة مرة واحدة في الوثيقة ل في حين أنها في الوثيقة 8 حدثت ثلاث مرات» 
فليس من المعقول بالضرورة أن نستنتج أن هذه الكلمة هي ثلاثة أضعاف أهمية واصف الوثيقة 
8 مقارنة بالوثيقة . وللحصول على نظام 11011 أكثر اتساقًا لإجراء مزيد من التحليلء فيجب 
أولّا تطبيع هذه المؤشرات الأؤّلية. وعلى عكس إظهار التعداد الفعلي للتردد, فإنه يمكن تطبيع 
التمثيل العددي بين المصطلحات والوثائق باستخدام عدد من الطرق البديلة» مثل ترددات السجل 
والترددات الثنائية وترددات الوثائق العكسيةء وغيرها. 

تقليل أبعاد المصفوفة: نظرًا لأن نظام 11034 غالبًا ما يكون [S‏ جدًا ومتناثرًا إلى حد ما (معظم 
الخلايا مملوءة بالأصفار). فإن السؤال الآخر المهم هو «كيف هكننا تقليل أبعاد هذه المصفوفة إلى 
حجم معقول؟» حيث تتوفر العديد من الخيارات المتاحة لإدارة حجم المصفوفة. 
- يمر خبير المجال بقائمة المصطلحات ويزيل تلك التي لا معنى لها لسياق الدراسة (عملية يدوية 

تتطلب عمالة كثيرة). 

- إلغاء الشروط مع عدد قليل جدًّا من الظروف في عدد قليل جدًّا من الوثائق. 
- تحويل المصفوفة باستخدام انحلال القيمة المفردة SVD‏ 

ويؤدي انحلال القيمة المفردة ((55971). والذي يرتبط ارتباطًا وثيقًا بتحليل المكونات الأساسية, 
إلى تقليل الأبعاد الإجمالية لمصفوفة الإدخال (عدد وثائق الإدخال حسب عدد ال مصطلحات 
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الممستخرجة) إلى مساحة أصغرء حيث يمثل كل بُعد تالي أكبر درجة ممكنة من التقلبية (بين 
الدرجات والوثائق) (1999 (Manning & S1٤6,‏ ومن الناحية المثالية:ء فإن المحلل قد 
يحدد البعدين أو الثلاثة أبعاد الأبرز التي تمثل معظم التباين (الاختلافات) بين الكلمات والوثائق» 
وبالتالي تحديد المساحة الدلالية الكامنة التي تنظم الكلمات والوثائق في التحليل. وبمجرد تحديد 
هذه الأبعادء يتم استخراج ”المعنى“ الأساسي يلا هو موجود (تمت مناقشته أو وصفه) في الوثائق. 


المهمة ؟: استخراج المعرفة: 

حيث يتم استخراج أنماط جديدة في سياق المشكلة المحددة التي يتم تناولهاء باستخدام 
نموذج 11224 المنظم جيدَاء والذي يمكن زيادته مع عناصر بيانات منظمة أخرى. أما الفئات 
الرئيسة لطرق استخلاص المعرفة فهي التصنيفء والتجميع, والاقتران» وتحليل الاتجاهات. وفيما 
يلي وصف موجز لهذه الطرق. 

التصنيف: وهمكن القول أن أكثر موضوعات اكتشاف المعرفة شيوعًا في تحليل مصادر البيانات 
المعقدة هو تصنيف أشياء معينة. وتتمثل المهمة في تصنيف البيانات المعطاه إلى مجموعة من 
الفئات المحددة مسبقًا. كما أنه ينطبق على مجال التنقيب في النص» حيث تعرف اممهمة باسم 
تصنيف النص. فبالنسبة لمجموعة معينة من الفئات (الموضوعات أو النقاط أو المفاهيم) ومجموعة 
من الوثائق النصية فإن الهدف هو العثور على الموضوع الصحيح (الموضوع أو المفهوم subject‏ 
]0026© 07) لكل وثيقة باستخدام النماذج التي تم تطويرها مع مجموعة بيانات التدريب التي 
تنضمن كلاً من الوثائق وفئات الوثائق الفعلية. واليوم يتم تطبيق تصنيف النص التلقائي في 
مجموعة متنوعة من السياقات» ها في ذلك فهرسة النص التلقاني أو شبه التلقائي (التفاعلي)» وتصفية 
الرسائل غير ا مرغوب فيهاء بالإضافة إلى تصنيف صفحات الويب ضمن كتالوجات هرميةء وتوليد 
(lab‏ للبيانات الوصفية؛ واكتشاف النوع» فضلا عن العديد من الأنواع الأخرى. 

وأما النهجان الرئيسان لتصنيف النصء فهما هندسة المعرفة وتعلم الآلة 
.(Feldman & Sanger, 2007)‏ وباستخدام منهج هندسة المعرفة يتم ترميز معرفة الخبير حول 
الفئات في النظام إما بصورة عرضية أو في شكل قواعد تصنيف إجرائية. أما مع منهج تعلم الآلة, 
فإن العملية الاستقرائية العامة تبني مصنقًا من خلال التعلم من مجموعة من الامثلة المعاد 
تصنيفها. ومع زيادة عدد الوثائق بمعدل أسيء ومع ازدياد صعوبة معرفة ely‏ المعرفة, فإن 
الاتجاه الأكثر انتشارًا بين الاثنين هو الاتجاه نحو نهج تعلم الآلة. 
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التجميع: وهو عملية غير خاضعة للإشراف؛ حيث يتم تصنيف الكائنات إلى مجموعات 
«طبيعية» تسمى المجموعات. بالمقارنة مع التصنيف الذي يتم فيه استخدام مجموعة من الأمثلة 
التدريبية المصنفة مسبقًا لتطوير نموذج يعتمد على السمات الوصفية للفئات لتصنيف مثال 
جديد غير مذكور. أما في التجميعء فإن المشكلة تتمثل في تجميع مجموعة غير معلمة من الأشياء 
(مثل: الوثائق» والزبون» والتعليقات» وصفحات الويب) في مجموعات ذات مغزى دون أي معرفة 


مسبقة. 


ويُعد التجميع مفيدًا في نطاق واسع من التطبيقات, بدءًا من استرجاع الوثائق إلى تمكين 
عمليات بحث أفضل في محتوى الويب. وفي الواقع» فإن أحد التطبيقات البارزة للتجميع هو 
التحليل والإبحار في مجموعات نصية كبيرة جدّاء مثل صفحات الويب. والافتراض الأساسي هو أن 
الوثائق ذات الصلة تميل إلى أن تكون أكثر تشابهًا مع بعضها البعض من غير التي ليس لها صلة 
با لموضوع. فإذا كان هذا الافتراض قائماه فإن تجميع الوثائق اعتمادًا على تشابه محتواها يُحسّن 
فعالية البحٹ )2007 :(Feldman & Sanger,‏ 
- استرجاع بحث تم تحسينه: ولأن التجميع يستند إلى تشابه عام بدلا من وجود مصطلح واحده 
فإنه من الممكن أن يؤدي إلى تحسين استرجاع بحث معتمد على الاستعلام بطريقة تطابق 
استعلام وثيقة يمكن استرجاع المجموعة الكاملة منها. 
- تحسين دقة البحث: حيث هكن للتجميع أيصًا أن يحسن دقة البحث. فمع نمو عدد الوثائق في 
مجموعة: يصبح من الصعب استعراض قائمة الوثائق المطابقة. ويمكن أن يساعد التجميع على 
تجميع الوثائق في عدد من المجموعات الأصغر حجمًا من الوثائق ذات الصلة, وطلبها حسب 
الصلة وعرض الوثائق من المجموعة (أو المجموعات) الأكثر صلة. 
وأما الطريقتان الأكثر شيوعًا للتجميع فهما التجميع المبعثر / المجمع والتجميع الخاص 
بالاستعلام: 
- التجميع المبعثر: حيث يُستخدم التجميع كطريقة لتصفح الوثائق وذلك لتحسين كفاءة التصفح 
البشري للوثائق عندما لا يمكن صياغة استعلام بحث معينء معنى أن هذه الطريقة تقوم 
بشكل ديناميي بإنشاء جدول محتويات لمجموعة وتقوم بتكيفها وتعديلها استجابةٌ لاختيار 
المستخدم. 
- التجميع الخاص بالاستعلام عداإماuاc‏ cificمsp-رQuer:‏ وتستخدم هذه الطريقة نهجًا 
تجميعي ا للتسلسل الهرمي حيث تظهر أكثر الوسائل ذات الصلة بالاستعلام المطروح في 


£o1‏ ذكاء الأعمال والتحليلات وعلم البيانات. منظور إداري 


التحليلات التنبؤية (؟): تحليلات النص والويب ووسائل التواصل الاجتماعي 


مجموعات ضيقة صغيرة متداخلة في مجموعات أكبر تحتوي على وثائق أقل تشابهًاء مما 
يؤدي إلى وجود مجموعة من مستويات الملاءمة بين الوثائق. وتؤدي هذه الطريقة أداءً جيدًا 
ممجموعات الوثائق ذات الأحجام الكبيرة واقعيًا. 
الاقتران: وقد تم تقديم تعريف رسمي ووصف مفصل للاقتران في الفصل الخاص بالتنقيب 
في البيانات (الفصل الرابع). يُعد تعليم الارتباط أو قواعد الارتباط في مجال التنقيب في البيانات 
أسلوبًا شائعًا وبحنًا جيدًا لاكنشاف علاقات مثيرة للاهتمام بين المتغيرات في قواعد البيانات 
الكبيرة. وتتمثل الفكرة الرئيسة في إنشاء قواعد الارتباط (أو حل مشكلات سلة السوق) في تحديد 
المجموعات المتكررة التي تتماثى Aa‏ 
وفي التنقيب في النصء يشير الارتباط تحديدًا إلى العلاقات المباشرة بين المفاهيم (المصطلحات) 
أو مجموعات المفاهيم. ويمكن تحديد مفهوم مجموعة قواعد القاعدة 4+0 المتعلقة بمجموعتي 
المفهوم المتكررتين .4 و0 بواسطة المقياسين الأساسيين للدعم والثقة. وفي هذه الحالة» فإن الثقة 
هي النسبة المئوية للوثائق التي تتضمن جميع المفاهيم في © داخل نفس المجموعة الفرعية من 
تلك الوثائق التي تتضمن جميع المفاهيم في 4. أما الدعم فهو النسبة (أو العدد) من الوثائق 
التي تتضمن جميع المفاهيم في JUL Jus es A‏ فقد يظهر في مجموعة الوثائق مفهوم 
”فشل تنفيذ البرامج“ غالبًا مقترنًا مع ”تخطيط موارد المؤسسة» و”إدارة علاقات العملاء“ بدرجة 
دعم معنوي )٤(‏ ومستوى ثقة (00)» وهذا يعني أن >٤‏ من الوثائق كانت تشتمل على جميع 
امفاهيم الثلاثة ممثلة في نفس الوثيقةء والوثائق التي شملت ”فشل في تنغيذ البرامج“» 00 منها 
شملت أيضًا ”تخطيط موارد المؤسسات» و”إدارة علاقات العملاء". 
وقد تم استخدام التنقيب في النص مع قواعد الاقتران لتحليل الأدبيات المنشورة (الأخبار 
والمقالات الأكاديمية المنشورة على الويب) لرسم تَفَشّي مرض أنفلونزا الطيور Mahgoub) ejsls3‏ 
وآخرون» .)7٠١8‏ كانت الفكرة هي تحديد الارتباط التلقائي بين المناطق الجغرافية» والانتشار عبر 
الأنواع» والتدابير المضادة (العلاجات). 
تحليلات الاتجاه: تستند الأساليب الحديثة لتحليلات الاتجاه في مجال التنقيب في النص على 
فكرة أن أنواع مختلفة من توزيعات المفهوم هي وظائف مجموعات الوثائق» وهذا يعني أن 
مجموعات مختلفة تؤدي إلى توزيعات مختلفة للمفهوم لنفس مجموعة المفاهيم. ولذلك؛ فإنه من 
الممكن مقارنة التوزيعين اللذين يتطابقان بشكل ما إلا أنهما من توزيعات فرعية مختلفة. ويتمثل 
أحد الاتجاهات الملحوظة لهذا النوع من التحليل في وجود مجموعتين من نفس المصدر (على سبيل 
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المثال من نفس مجموعة الدوريات الأكاديمية) ولكن من نقاط زمنية مختلفة. وقد طبق كل من 
2 و020551300 )٠٠١8(‏ تحليل الاتجاه على عدد كبير من المقالات الأكادهية (المنش ورة في 
المجلات الأكادمية الثلاث الأعلى تصنيقًا) لتحديد تطور المفاهيم الأساسية في مجال نظم المعلومات. 
وكما هو موضح في هذا القسم» فإن هناك العديد من الطرق المتاحة للتنقيب في النص. وتصف 
الحالة العملية (0-0) استخدام عدد من التقنيات المختلفة في تحليل مجموعة كبيرة من الأدبيات. 
حالة عملية 0-0 
مسح بحوث الأدبيات بالتنقيب في النص 
يواجه الباحثون الذين يجرون عمليات بحث واستعراض للأدبيات ذات الصلة مهمة 
معقدة وضخمة على نحو متزايد. وقد كان من المهم دائمًا العمل بجد لجمع المعلومات 
الحالية من الأدبيات وتنظيمها وتحليلها واستيعابهاء من أجل توسيع نطاق المعرفة ذات 
الصلةء لا سيما من خلال الانضباط المنزلي. ومع تزايد وفرة الأبحاث الهامة المحتملة 
التي يتم الإبلاغ عنها في المجالات ذات الصلة» وحتى في المجالات التي تعتبر تقليديًا 
حقولًا غير مرتبطة بالدراسة: OB‏ مهمة الباحث تصبح أكثر صعوبةء إذا كانت هناك 
حاجة إلى عمل شامل. 
وفي تي ارات البحث الجديدة. قد تكون مهمة الباحث أكثر مللا وتعقيدًا. ففي 
أحسن الأحوالء قد يكون من الصعب محاولة العثور على الأعمال ذات الصلة التي 
ذكرها الآخرون بل وربما يكون شبه مستحيل إلى حدٍ كبير إذا كانت هناك حاجة إلى 
مراجعات تقليدية» للأبحاث المنشورة. فحتى مع وجود مجموعة من طلاب الدراسات 
العليا المتفانين أو الزملاء المساعدينء فإن محاولة تغطية جميع الأعمال المنشورة ذات 
الصلة المحتملة هي إشكالية. 
وهناك العديد من المؤتمرات العلمية التي تُعقد كل عام, بالإضافة إلى توسيع نطاق 
المعرفة بالتركيز الحالي على المؤتمرء حيث يرغب المنظمون في كثير من الأحيان في تقديم 
111185 وورش عمل إضافية. وفي العديد من الحالات. تهدف هذه الأحداث 
الإضافية إلى تعريف الحضور على تيارات بحث مهمة في مجالات الدراسة ذات الصلة 
ومحاولة تحديد ”الشيء الكبير التالي" من حيث الاهتمامات البحثية والتركيز. وغالبًا ما 
يكون تحديد مواضيع المرشح ال معقول بمثل هذه الثورات وورش العمل ذاتيًا بدلا من 
اشتقاق موضوعي من الأبحاث الحالية والناشئة. 
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às‏ دراسة حديثة اقترح كل من 106165 )٠٠١8( Crosslans‏ طريقة تساعد جهود 
الباحثين بشكل كبير وتعززها من خلال تمكين التحليل شبه الآلي للكميات الكبيرة من 
الأبحاث المنشورة من خلال تطبيق التنقيب في النص. وباس تخدام المكتبات الرقمية 
القياسية ومحركات بحث النشر على الإنترنت. قام المؤلفون بتنزيل وجمع جميع 
المقالات المتاحة للمجلات الثلاث الرئيسة في مجال نظم المعلومات الإدارية: MISQ‏ 
ربع السنوي (20150). وبحوث نظم المعلومات 1519)» ومجلة نظم معلومات الإدارة 
.(JMIS)‏ وللحفاظ على الفترة الزمنية نفسها لجميع المجلات الثلاث (للدراسات الطولية 
المقارنة المحتملة). تم استخدام المجلة مع تاريخ البدء الأخير لتوفر النشر الرقمي كوقت 
بدء هذه الدراسة (أي أن مقالات 118[ متوفرة رقميًا منذ »)۱۹۹١‏ بالنسبة لكل مقالة, 
حيث قاموا باستخلاص العنوان» والملخصء وقائمة المؤلفين» والكلمات المفتاحية ال منشورة. 
والحجم» ورقم الإصدارء وسنة النشرء ثم قاموا بتنزيل كل بيانات المقالة في ملف قاعدة 
بيانات بسيط. كما تم تضمينه في مجموعة البيانات المدمجة التي لها مجال مشترك, 
والذي يحدد نوع المجلة لكل مادة من أجل تحليل تمييزي محتمل. كماتم حذف 
الملاحظات التحريرية والملاحظات البحثية والنظرات العامة التنفيذية من المجموعة. 
يوضح الجدول التالي كيفية عرض البيانات بتنسيق جدولي. 

وقد اختاروا في مرحلة التحليل استخدام ملخص للمقالة فقط كمصدر لاستخراج 
المعلومات. كما اختاروا عدم تضمين الكلمات ا مفتاحية المدرجة في ا منشورات لسببين 
رئيسين: )١(‏ في ظل الظروف العادية» فإن الملخص سيش مل بالفعل الكلمات اللفتاحية 
المدرجة. وبالتالي فإن إدراج الكلمات المفتاحية المدرجة للتحليل سيعني تكرار نفس 
المعلومات ويحتمل أن يمنحهم وزنًا غير مستحق, (Y)‏ قد تكون الكلمات المفتاحية المدرجة 
عبارة عن كلمات يرغب المؤلفون في أن ترتبط مقالتهم بها (على عكس ما هو موجود فعلًا 
في المقالة). وبالتالي قد يكون من المحتمل تقديم تحيز غير قابل للتحليل لتحليل المحتوى. 





12 |العام | مجلة نبذة مختصرة 





الحاجة إلى ابتكار قيم مستمرة هي دفع سلاسل 
التوريد للتطور من 
على الرغم من أن الكثير من الأفكار المعاصرة تعتبر 
تقنية المعلومات ايلتقدمة. 


11150 | 2005 |) 1 








ISR | 1999 | 2 

















3 | 2001 | 11/115 | عندما يواجه منتجو البضائع (أو الخدمات) وضعًا والذي ... 
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ID‏ العام مجلة نبذة مختصرة 





4 | 1995 | 1512 | أصبحت أهمية الحفاظ على الذاكرة التنظيمية مهمة ل ... 


البحث الوارد هنا هو تكيف لنموذج تم تطويره 
soldi‏ 





ISR | 1994 | PID005 





6 | 1995 | 211500 | تقيم هذه الدراسة مدى القيمة المضافة للعملاء من ... 





هذه الورقة هي تقارير لنتائج (-) من دراسة ميدانية 
لستة فرّق للمشروع الطبي ... 
8 | 1999 | 11115 | بدأ الباحثون والمديرون يدركون أن المزايا الكاملة .... 


MISQ| 2003 | PID007 








تقنيات التجارة عر الإنترنت قد خَفُضت إلى حد كبير 


JMIS | 2000 | PID009 
تكاليف البائعين.‎ 





نظرية التركيب التكيفية (451) أصبحت بسرعة 
نظرية مؤثرة. 

يظهر البحث أن نظم دعم المجموعة (655) قد زادت 
بشكل كبير. 

يطالب سير الأعمال بشكل متزايد بأن تلعب تقنية 
المعلومات دور الأعمال التجارية. 


ISR | 1997 | PID0010 





JMIS | 1995 | PID0011 


MISQ | 2000 | PID0012 





من المعتقد على نطاق واسع أن التوافق بين إستراتيجية 
العمل وإستراتيجية IS‏ 


ISR | 2001 | PID0013 





تم توضيح إطار يتضمن تخطيط أهداف تقنية 


JMIS | 1999 | PID0014 
ال معلومات وتحديدها.‎ 





5 | 1999 | 1315 | الأهمية المتزايدة باستمرار لتقنية المعلومات (11) تتطلب ... 





6 1994 | 20150 | تحديد أفضل طريقة لتنظيم وظائف 15 داخل اللؤسسة. 





PID0017‏ | 1996 | 151 | أسباب ردود الفعل المختلطة لتداول اليوم الإلكتروني غير التبادلي. 

















JMIS | 1996 | PID0018‏ | آثار الأداء لاستثمارات تقنية المعلومات في المنظمة. 
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ID‏ | العام | مجلة نبذة مختصرة 





الكشف عن الهوية فهوم أساسى 4 È‏ 
i JMIS | 1997 | PID0019‏ عن الهوية هو مفهوم أسامي في بحوث 
نظم دعم المجموعة GSS)‏ 
على الرغم من أن التجارة الإلكترونية (©8) قد خلقت 
فرضًا جديدة للعمل. 


671 2005 | 12115 | فهم الاعتماد الناجح لتقنية المعلومات إلى حد كبير. 





ISR | 2002 0 








نظم تخطيط موارد المؤسسة (818) وغيرها من 
المعلومات المعقدة. 


111500 | 2005 PIDO0022 





JMIS | 1994 | PID0023‏ | نظم إدارة نموذج دعم نماذج في مختلف مراحل النموذج. 
بينما يتم التعرف على تدريب الحاسب على نطاق 
واسع باعتباره الحاسب الأسامي. 





ISR |1995 | PID0024 














وقد كانت الدراسة الاستكشافية الأولى هي النظر في المنظور الطولي للمجلات الثلاث 
(أي تطوير موضوعات البحث بمرور الوقت). ومن أجل إجراء دراسة طوليةء قسموا فترة 
ال ١1‏ سنة (من 1994 إلى 27٠٠0‏ إلى أربع فترات بحيث تكون كل فترة عبارة عن ثلاث 
سنوات لكل من المجلات الثلاث. وقد أدى هذا الإطار إلى VY‏ تجربة للتنقيب في النص 
مع ؟١‏ مجموعة من البيانات الحصرية المتبادلة. عند هذه النقطة. وقد استخدمت 
كل مجموعة من مجموعات البيانات الاثنتي عشرة التنقيب في النص لاستخراج أكثر 
العبارات وصفية من هذه المجموعات من المقالات التي تمثلها ملخصاتهاء وتم جدولة 
النتائج وفحصها للتغييرات الزمنية المتغيرة في الشروط المنشورة في هذه المجلات الثلاث. 

وكاستكشاف ثان, باستخدام مجموعة البيانات الكاملة Ue)‏ في ذلك المجلات الثلاث 
وجميع الفترات الأربع)» قاموا بإجراء تحليل للتجميع. وهكن القول أن التجميع هو 
أكثر تقنيات معالجة النصوص استخدامًا. وقد تم استخدام التجميع في هذه الدراسة 
لتحديد المجموعات الطبيعية للمقالات (عن طريق وضعها في مجموعات منفصلة) ثم 
سرد أكثر العبارات وصفية التي ميزت تلك المجموعات. كما استخدموا 5۷2 لتقليل 
الأبعاد من مصفوفة الوثائق من قبلء ومن ثم خوارزمية تعظيم التوقعات لإنشاء 
التجمعات. وقد أجريت العديد من التجارب لتحديد العده الأمثل للمجموعات» والتي 
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تبين أنها تسعة. وبعد بناء التجمعات التسعة. قاموا بتحليل محتوى تلك المجموعات 
من منظورين: )١(‏ تمثيل نوع المجلة (انظر الشكل 8-0أ). (1) تمثيل الوقت (الشكل 
8-5ب). وكانت الفكرة هي استكشاف الاختلافات المحتملة والقواسم المشتركة بين 
المجلات الثلاث والتغييرات المحتملة في التركيز على هذه المجموعات؛ أي للإجابة على 
أسئلة مثل: ”هل هناك مجموعات تمثل مواضيع بحث مختلفة خاصة مجلة واحدة؟“ 
و”هل هناك توصيف زمني متفاوت لهذه المجموعات؟“ اكتشفوا وناقشوا عدة أنماط 
مثيرة للاهتمام باستخدام تمثيل جدولي ورسوم بيانية من النتائج التي توصلوا إليها 
(وطزيد من المعلومات. انظر: 2008 .(Delen & Crossland,‏ 


-١‏ كيف يمكن استخدام التنقيب في النص لتسهيل المهمة التي لا يمكن التخلب عليها 
مراجعة الأبحاث المنشورة؟ 

- ماهي النتائج الشائعة لمشروع التنقيب في النص لمجموعة محددة من مقالات 
الدوريات؟ وهل يمكنك التفكير في النتائج المحتملة الأخرى التي لم يتم ذكرها في هذه الحالة؟ 
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التحليلات التنبؤية (؟): تحليلات النص والويب ووسائل التواصل الاجتماعي 























e Histogram of JOURNAL; categorized by CLUSTER 
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e Histogram of YEAR; categorized by CLUSTER 
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Source: Delen, D., & Crossland, M. (2008). Seeding the survey and analysis of research literature 
with text mining. Expert Systems with Applications, 34(3), 1707- 1720. 


ew 


الشكل 6-5: أ- ت 





زيع عدد المقالات للمجلات الثلاث على المجموعات التسع 
ب- تطوير المجموعات التسع على مر السنين 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


الفصل الخامس 


أسئلة مراجعة على القسم 0-0: 
-١‏ ما هي الخطوات الرئيسة في عملية التنقيب في النص؟ 
۲- ما هو سبب اعتدال ترددات الكلمات؟ وما هي الطرق الشائعة لاعتدال ترددات الكلمات؟ 
۴- ما هو $SVD‏ وكيف يتم استخدامه في التنقيب في النص؟ 
ع- ما هي طرق استخراج المعرفة الأساسية من مجسم القوانين؟ 
٥‏ تحليل المشاعر: 

نعتبر نحن البشر كائنات اجتماعية بارعة في الاستفادة من مجموعة متنوعة من وسائل 
التواصل» وكثيرًا ما نتشاور مع منتديات المناقشة المالية قبل اتخاذ قرار الاستثمار؛ فنسأل أصدقاءنا 
عن آرائهم حول مطعم تم افتتاحه حدينًا أو فيلم تم إنتاجه حديئَ؛ كما نقوم بإجراء عمليات 
بحث على الإنترنت وقراءة تعليقات المستهلكين وتقارير الخبراء قبل إجراء عملية شراء كبيرة مثل 
منزل أو سيارة أو جهاز. ونحن نعتمد على آراء الآخرين لاتخاذ قرارات أفضلء خاصة في منطقة 
لا نملك فيها الكثير من المعرفة أو الخبرة. وبفضل تزايد توافر موارد الإنترنت الغنية بالرأي مثل 
وسائل التواصل الاجتماعي (مثل 15716161 و )0 0 ط۲٤‏ ۴۵) ومواقع المراجعة على الإنترنت واممدونات 
الشخصية؛ أصبح الآن من السهل أكثر من أي وقت مضى العثور على آراء الآخرين (الآلاف منهم, 
كما هو واقع الأمر) على كل شيء من أحدث الأدوات إلى الشخصيات السياسية والعامة. وعلى 
الرغم من عدم التعبير عن آراء عبر الإنترنت - بسبب الغالبية المتزايدة لعدد قنوات التواصل 
الاجتماعي وقدراتها - إلا أن الأرقام تتزايد بشكل كبير. ومن الصعب وضع تعريف محدد لكلمة 
المشاعرء حيث إنها غالبًا ما ترتبط بمصطلح ات أخرى أو تختلط معها مثل الاعتقاد. والرؤية, 
والرأي» بالإضافة إلى القناعة. وتشير المشاعر إلى وجود رأي ثابت يعكس مشاعر Mejova,) sl‏ 
9. وللمشاعر بعض الخصائص الفريدة التي تميزها عن المفاهيم الأخرى التي قد نرغب في 
تحديدها في النص. وغالبًا ما نرغب بتصنيف النص حسب الموضوع. والذي قد يتضمن التعامل 
مع تصنيفات كاملة للموضوعات. ومن ناحية أخرىء فعادةً ما يقوم تصنيف المشاعر بالتعامل 
مع فئتين (إيجابي مقابل سلبي)» أو نطاق من التناقض (على سبيل المثال» تصنيف النجوم للأفلام)» 
أو حتى نطاق قوة الرأي (2008 ,1.66 8 5228). وتمتد هذه الفئات لتشمل العديد من المواضيع 
وا لمستخدمين والوثائق. وعلى الرغم من أن التعامل مع فئات قليلة فقط قد يبدو مهمة أسهل 
من تحليل النص القياسيء إلا أن هذا أبعد ما يكون عن الحقيقة. 

وكمجال للبحثء فإن تحليل المشاعر يرتبط ارتباطًا وثيقًا باللسانيات الحاسوبية معالجة اللغات 
الطبيعية N1۲‏ والتنقيب à‏ النصوص. ولتحليل المشاعر العديد من الأسماء وغالبًا ما يشار 
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إليه على آنه استخراج الرأيء وتحليل الذاتيةء واستخراج التقييم» مع بعض الاتصالات بالحوسبة 
العاطفية (التعرف على الحاسب والتعبير عن الانفعال). إن الاندفاع المفاجئ في الاهتمام والنشاط 
في مجال تحليل المشاعر (أي استخراج الرأي)» الذي يتناول الاستخراج التلقائي للآراء والمشاعر 
والدهوقراطية في النص» ينتج فرصًا وتهديدات للشركات والأفراد على حد سواء» ولن يستفيد منها 
سوى الأشخاص الذين يتقبلونها وينتفعون منها ... وسوف يتم اعتماد كل رأي يتم طرحه على 
الإنترنت من قبل فرد أو شركة إلى المنشئ (جيد أو سيئ) كما سيتم استرداده واستخراجه بواسطة 
الآخرين (غالبًا ما يتم تلقائيًا بواسطة برامج الحاسب). 

ويحاول تحليل المشاعر الإجابة عن السؤال التالي «ما الذي يشعر به الناس تجاه موضوع معين؟» 
عن طريق البحث في آراء الكثيرين باستخدام مجموعة متنوعة من الأدوات الآليةء وذلك من خلال 
الجمع بين الباحثين والممارسين في مجالات الأعمال وعلوم الحاسب واللغويات الحاسوبية والتنقيب في 
البيانات والتنقيب في النصوص بالإضافة إلى علم النفس وحتى علم الاجتماع. ويهدف تحليل المشاعر إلى 
توسيع نطاق تحليل النصوص القائم على الحقائق التقليدية إلى حدود جديدة لتحقيق نظم المعلومات 
الموجهة نحو الرأي العام. وفي إطار الأعمال التجارية. خاصة في التسويق وإدارة علاقات العملاء يسعى 
تحليل المشاعر إلى الكشف عن الآراء الإيجابية وغيرها تجاه منتجات أو خدمات معينة باستخدام أعداد 
كبيرة من مصادر البيانات النصية (ملاحظات العملاء في شكل نشرات الويبء وتويتر والمدونات» إلخ). 

ويأق الشعور الذي يظهر في النص بصفتين مميزتين: كونه to po‏ حيث تعبر الجملة الشخصية 
مباشرة عن رأي (”إنه يوم رائع“)» كما أنه ضمنيًا؛ حيث يشير النص إلى رأي (”ينفصل المقبض بسهولة 
كبيرة“). وقد ركز معظم العمل السابق في تحليل المشاعر على النوع الأول من المشاعر لأنه أسهل في 
التحليل. أما الاتجاهات الحالية» فهي تنفيذ طرق تحليلية للنظر في المشاعر الضمنية والصريحة. إن 
تناقض المشاعر هي سمة خاصة للنص الذي يركز تحليل المشاعر في المقام الأول عليه» وعادةٌ ما يتم 
تقسيمها إلى قسمين: موجبة وسالبة» ولكن يمكن اعتبار الأقطاب أيضًا كنطاق. وسوف يعتري الوثيقة 
التي بها العديد من البيانات المرتقبة خلط في التناقض الكاملء وهو يختلف عن عدم وجود تناقض 
مطلقًا (كونها موضوعية؛ 2009 ,816[078). إن جمع وتحليل البيانات النصية في الوقت المناسب» 
والتي قد تأتي من مجموعة متنوعة من المصادر - بدءًا من نسخ مراكز اتصال العملاء إلى منشورات 
وسائل التواصل الاجتماعي - تعد جزءًا هاما من قدرات الشركات الاستباقية والتركيز على العملاء في 
الوقت الحاضرء وفي كثير من الأحيان يتم تصوير هذه التحليلات بشكل فوري للبيانات النصية في 
لوحات المعلومات سهلة الفهم. وتقدم الحالة العملية (1-0) قصة نجاح العميل» حيث يتم استخدام 
مجموعة من حلول التحليلات جماعيًا لتعزيز تجربة المشاهدين في بطولة ويمبلدون للتنس. 
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حالة عملية 5-4 


إنشاء تجربة رقمية فريدة لرصد اللحظات المهمة في وهبلدون 
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وتُعرف ببساطة بللايين من المشجعين باسم «وهمبلدون», وهي أقدم بطولات التنس 
الأربع الكبرىء وهي واحدة من أرقى الأحداث الرياضية في العام» وقد تم تنظيمها 
All England Lawn Tennis Club (AELTC) ($35 (3 5a‏ والذي يُعد مؤسسة 
رياضية وثقافية عالمية MW ele Azo‏ 

بطل البطولات: 

إن منظمي بطولات وهبلدونء AELTCK5‏ لديهم هدف بسيط: فهم يريدون 
استضافة أفضل بطولات التنس في العالم كل عام - بكل طريقة» وبكل مقياس. 

والدافع وراء هذا الالتزام ليس مجرد الكبرياء؛ كما أن لديها أساسا تجاريًا. فقد تم بناء 
علامة ويمبلدون lias bI Laa de iola (Wimbledon)‏ ما يجذب كلا من 
المعجبين والشركاء. وتسعى أفضل المنظمات الإعلامية في العالم وأعظم الشركات - بما في ذلك 
6 - أن تكون مرتبطة مع ويمبلدون على وجه التحديد بسبب سمعتها للتميز. 

ولهذا السببء يعد الحفاظ على هيبة البطولة من أهم أولويات à$Js -AELTC‏ 
هناك طريقتان فقط يمكن أن تتحكم فيهما المنظمة مباشرة في كيفية النظر إلى بقية 
البطولات من قبل بقية العام. 

الأولى والأكثر أهمية هي: توفير تجربة رائعة للاعبين والصحفيين والمتفرجين 
المحظوظين Ue‏ يكفي لزيارة ومراقبة ملعب التنس. وتتمتع 481:10 بخبرة كبيرة في 
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هذا المجال. ففي عام /ا14. أقامت منافسة مثيرة ورائعة على مدار أسبوعين في أجواء 
شاعرية: التنس في الريف الإنجليزي. 

والثانية هي: الحضور للبطولة عبر الإنترنت» والذي يتم تسليمه عبر موقع الويب 
colis» wimbledon.com‏ الجوال وقنوات التواصل الاجتماعي. وهذا التطور المستمر 
لهذه المنصات الرقمية هو نتيجة شراكة مدتها IBMs AELTC o le Y‏ 

Mick Desmond gés:‏ ا مدير التجاري والإعلامي في 451:10 قائلًا: «عندما 
تشاهد وهبلدون على التلفاز فإنك تشاهده من خلال عدسة المذيع. ونحن نفعل كل ما 
في وسعنا لمساعدة شركائنا في وسائل التواصل على تقديم أفضل عرض ممكن. ويختلف 
النظام الرقمي؛ فهو نظامنا الأساسي. حيث همكننا التحدث مباشرة مع المعجبين لديناء لذلك 
فمن المهم أن نقدم لهم أفضل تجربة ممكنة؛ وإذا أردنا تعزيز علامتنا التجاريةء فنحن 
بحاجة إلى أن يشاهدوا تجربتنا الرقمية كمركز رقم واحد متابعة البطولة على الإنترنت“. 

ولذا؛ فقد استهدفت ۸۴11۲٥‏ جذب ۷۰ ملیون زيارة. و۲۰ ملیون جهاز فرید 
و8 ملايين متابع خلال أسبوعين من بطولة ۲۰۱١‏ وكان الأمر متروكًا لشركتي 1811 و 
٣‏ لإيجاد طريقة للتوصيل. 

نقل تجربة رقمية فريدة: 

شرعت 18M‏ و ۸۴1۲٣‏ ف إعادة تصميم كاملة للمنصة الرقميةء وذلك باستخدام 
معرفته م الوثيقة بجماهير البطولات بهدف تطوير تجربة مصممة خصيصًا لجذب 
مشجعي التنس من جميع أنحاء العام والإبقاء عليهم. 

تقول 1111115 416<2202» رئيس قسم ال محتوى الرقمي في LSjol sä» :AELTC‏ 
أنه على الرغم من الأهمية المتزايدة للهاتف المحمولء فإن ۸٠‏ من زوارنا يستخدمون 
أجهزة الحاسب المكتبية للوصول إلى موقعنا على الويب» وكان التحدي الذي واجهنا 
لعام ۲١٠١‏ هو كيفية تحديث خصائصنا الرقمية للتكيف مع عالم متنقلء مع توفير 
أفضل تجربة ممكنة لسطح المكتب على الإطلاق. وقد أردنا بموقعنا الجديد أن يستفيد 
إلى أقصى حد من تلك الشاشة الكبيرة وهنح مستخدمي سطح المكتب أغنى تجربة 
ممكنة فيما يتعلق با مشاهد امرئية ومحتوى الفيديو ع الي الوضوح - بينما يتفاعلون 
أيضًا ويتكيفون بسهولة مع أشكال الأجهزة اللوحية أو الهواتف المحمولة الأصغر». 

وتضيف: «ثانيّاء ركزنا تركيراً عاليًا على وضع محتوى في السياقء أي تكامل المقالات 
مع الصور ومقاطع الفيديو والإحصاءات ومقتطفات المعلومات ذات الصلة. وتبسيط 
التنقل بحيث يمكن للمستخدمين الانتقال بسلاسة إلى المحتوى الأكثر أهمية لهم». 
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وبالنسبة لأجهزة المحمولء فقد أدرك الفريق أن إتاحة اتصالات 4G‏ بسعة تحميلية عالية 
يعني أن موقع الويب للمحمول سيصبح أكثر شعبية من أي وقت مضىء كما سيضمن سهولة 
الوصول إلى جميع محتوى الوسائط الغنية. وفي الوقت نفسه. تم تحسين تطبيقات المحمول 
في البطولات بإشعارات لنتائج المباريات في وقت حدوثهاء بل ويمكنها أيضًّا تقديم التحية 
للزوار أثناء مرورهم عبر المحطات في الطريق إلى الملاعب. 

كما قام الفريق ببناء مجموعة خاصة من المواقع الإلكترونية لأهم جماهير للعبة التنس» 
وهي اللاعبين أنفسهم؛ حيث قاموا - باستخدام تقنية «ذد»نا81* /188*- ببناء تطبيق ويب 
آمن يوفر للاعبين عرضًا شخصيًا لحجوزاتهم في الملعب, وتنقلاتهم, وأوقات اللعبء بالإضافة 
إلى مساعدتهم في مراجعة أدائهم بالوصول إلى إحصائيات كل مباراة لعبوها. 

تحويل البيانات إلى صورة مرئية - والصورة المرئية إلى قصة: 

ولتزويد منصاتها الرقمية بالمحتوى 3591 EU]‏ فقد استفاد الفريق من ميزة فريدة, 
وهي وصوله إلى البيانات الخاصة بكل تسديدة في كل مباراة خلال البطولة في وقت حدوثها. 
وعلى مدار أسبوعين من بطولة وهبلدونء fmd EA pB‏ تحكيميًا بجمع ما يقرب من 7,6 
مليون نقطة بيانات» وتتبع نوع اللقطةء والإستراتيجيات» ونتائج كل نقطة. 

ويتم جمع هذه البيانات وتحليلها في وقت حدوثها لإنتاج إحصاءات لمعلقي التلفاز 
والصحفيين وكذلك لفريق التحرير الخاص بالمنصة الرقمية. 

:Alexandra Willis J9à5‏ ”منحتنا شركة 18M‏ هذا العام ميزة لم نكن نملكها من 
قبلء وذلك باستخدام تقنية تدفق البيانات لتزويد فريق التحرير لدينا بنظرة فورية 
للمعالم البارزة والأخبار العاجلة“. 

وتضيف: ”وقد راقب النظام تلقائيًا تيارات البيانات القادمة من جميع الملاعب 
التسعة عشرء وكلما حدث شيء مهم مثل تحقيق 61018 دهد5 لثاني أسرع خدمة في 
البطولات» يتم إخبارنا بذلك على الفور. وخلال ثوانء تمكنا من جلب هذه الأخبار إلى 
جمهورنا الرقمي ومشاركتها على الشبكات الاجتماعية لزيادة عدد الزيارات إلى موقعنا. 

”وقد كانت القدرة على التقاط اللحظات ال مهمة والكشف عن الروايات الصريحة 
في البيانات» بشكل أسرع من أي شخص آخرء أمرًا أساسيًا. فإذا كنت ترغب في تجربة 
انفعالات بطولة 5م1171 <The‏ فإن أفضل ما يمكن أن يكون موجودًا في شخص ما هو 
""wimbledon.com ,Je cael áxiUs‏ 
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استغلال قوة اللغة الطبيعية: 

وقد خضعت للتجربة هذا العام قدرة أخرىء وهي استخدام تقنيات معالجة اللغات 
الطبيعية 711:2 الخاصة بشركة 1834 وذلك للمساعدة في تطوير المكتبة الضخمة لتاريخ 
التنس في 41:1:10 للحصول على معلومات ذات سياق جيد ومثيرة للاهتمام. وقد قام 
الفريق 18M Watson ~“ Engagement Advisor ws jan‏ على إستيعاب هذه المجموعة 
الغنية من البيانات غير الهيكلية واستخدامها للرد على الاستفسارات من المكتب الصحفي. 

كما تم ربط نفس واجهة معالجة usli Lf (NLP) ieuh)! DLH‏ بيانات منظمة 
شاملة لإحصائيات المطابقة. والتي يعود تاريخه ا إلى أول بطولة والتي كانت عام ۱۸۷۷ء 
والذي يجيب بشكل فوري على كل من الأسئلة الأساسية والاستفسارات الأكثر تعقيدًا. 

:Mick Desmond Js;‏ «وقد أظهرت تجربة 0ء۷ قدرًا کبیا من الإمكانات. 
وفي العام القادم» وكجزء من عملية التخطيط السنوي للابتكار فإننا سننظر في كيفية 
استخدامنا لها على نطاق أوسع - حيث نسعى في النهاية إلى منح المعجبين فرصة أكبر 
للوصول إلى هذا المصدر الغني بمعلومات التنس بشكل مذهل». 

الارتقاء للسحاب: 

لقد تمت استضافة البيئة الرقمية löd! Cloud Hybrid $ IBM Lë os JIL‏ 
بها. حيث استخدمت 181/6 تقنيات النمذجة المتطورة للتنبؤ بالذروات في الطلب على 
أساس الجدول الزمني» وشعبية كل لاعب» والوقت من اليوم» والعديد من العوامل 
الأخرى -مما مكنها من تخصيص موارد السحابة بشكل ديناميكي لكل جزء من المحتوى 
الرقمي وضمان تجربة سلسة ملايين الزائرين حول العام. 

وبالإضافة إلى منصة السحابة الخاصة القوية التي دعمت البطولة لعدة سنوات» استخدمت 
6 أيضًا سحابة :©تهآ:504* المنفصلة لاستضافة مركز قيادة ويمبلدون الاجتماعي وأيضًا 
توفير سعة إضافية لتكميل بيئة السحابة الرئيسة خلال أوقات الذروة للطلب. 

وتعتبر مرونة بيئة السحابة أمرًا أساسيًّا؛ نظرًا لآن المنصات الرقمية للبطولة تحتاج 
إلى أن تكون قادرة على التوسع بكفاءة من خلال عامل يزيد عن ٠٠١‏ في غضون أيام مع 
تزايد الفائدة قبل المباراة الأولى في املعب الرئيس. 

المحافظة على وهبلدون آمنة ومُحْكَمَة: 

يُعد الأمان على الإنترنت هو مصدر القلق الرئيس في الوقت الحاضر لجميع 
المنظمات. وبالنسبة للفعاليات الرياضية الكبرى على وجه الخصوصء فإن سمعة 
العلامة التجارية هي كل شيء - وبينما يراقب العام فإنه من امهم بشكل خاص تجنب 
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الوقوع كضحية سهلة للجرهة الإلكترونية ۴«ذإء-إءطرء. ولهذه الأسباب» يلعب الأمان 
دورًا حيويًا في شراكة -AELTC ga IBM‏ 

والجدير بالذكر أنه خلال الأشهر الخمسة الأولى من عام ۲١٠١‏ اكتشفت أنظمة أمان 
6 زيادة بنسبة 14٤‏ في الأحداث الأمنية على البنية التحتية 3دهء.ه00؟1طدتة”: مقارنةٌ 
بالفترة نفسها من عام folis Y «VE‏ للتهديدات الأمنية - وخاصة هجمات الحرمان من 
الخدمة الموزعة (105) - أصبحت 1814 أكثر انتشارًا بشكل مستمرء حيث تعمل على زيادة 
تركيزها من أجل توفير مستويات رائدة في صناعة الأمن للمنصة الرقمية الكاملة ل 41:1:10. 

وقد مكنت مجموعة كأملة من منتجات 181/1 الأمنيةء IBM QRadar* SIEM U3 à Le‏ 
IBM Preventia Intrusion Preventiong‏ بطولة هذا العام من العمل بسلاسة وأمانء 
ومنصة رقمية لتقديم تجربة مستخدم عالية الجودة في جميع الأوقات. 

أسر القلوب والعقول: 

كان نجاح النظام الرقمي الجديد لعام ٠١10‏ - بدعم من تقنيات سحابة IBM‏ 
وتقنيات التحليلات وتقنيات الجوال وبالإضافة إلى التقنيات الاجتماعية والأمنية - فوريًا 
وكاملا. وم يتم تحقيق أهداف إجمالي الزيارات والزوار الفريدين فحسب» بل تم 
تجاوزها أيضًا. إن تحقيق ١‏ ملیون زیارة و١٤٥‏ ملیون مشاهدة من ۲۱,۱ مليون جهاز 
فريد من نوعه يُظهر نجاح المنصة في جذب جمهور أكبر من أي وقت مضى. وإبقاء 
هؤلاء المشاهدين مشاركين طوال البطولة. 

تقول 5ذ!ا101 2:لسههدعل4: ”بشكل عام حققنا زيادة في الزيارات بنسبة ١١"‏ من 
أجهزة تجاوزت الأجهزة في عام ۲۰٠٤‏ بنسبة ۲۲ء مقارنة Y «V els)‏ وكان النمو في 
wimbledon.com plasi—ul‏ على الجوّال أكثر إثارة للإعجاب“. وتضيف قائلة: ”لقد 
شهدنا نموًا بنسبة 110“ في الأجهزة الفريدة على الجوّال ونهوًا بنسية 38 في إجمالي 
الزيارات ومو بنسبة 2۷۹ في إجمالي عدد مشاهدات الصفحة“. 

ويختتم 04ء٠0 M1)‏ قائا: «تظهر النتائج أنه في عام 27١10‏ فزنا في الاستحواذ 
على قلوب وعقول المشجعين. فقد يكون لدى الناس الصحف المفضلة ومواقع الويب 
الرياضية التي يزورونها لمدة 0٠‏ أسبوعًا من السنة - غير أنهم بدلا من ذلك قد جاءوا 
إلينا لمدة أسبوعينء وهذا دليل على الجودة المطلقة للتجربة التي يمكن أن نقدمها - 
واستغلال ميزاتنا الفريدة لجعلهم أقرب إلى العمل من أي قنوات تواصل أخرى. وقد 
ساعدت القدرة على التقاط وتوصيل المحتويات ذات الصلة فور وقوعها معجبينا على 
تحقيق مزيد من الاستمتاع بالبطولات أكثر من أي وقت مضى“. 
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أسئلة للمناقشة: 
-١‏ كيف استخدمت وهبلدون قدرات التحليلات لتعزيز تجربة المشاهدين؟ 
le -Y‏ هي التحديات والحل المقترح والنتائج التي حصلوا عليها؟ 
Source: IBM Case Study. Creating a unique digital experience to capture the‏ 


moments that matter. http://www-03.ibm.com/software/businesscasestudies/us/en/ 


corp?synkey-D140192K15783Q68 (accessed May 2016). 

تطبيقات تحليل المشاعر: 

بالمقارنة مع الأساليب التقليدية لتحليل ا لمشاعرء والتي كانت تستند إلى مسح أو مجموعة 
تركيز مركزة ومكلفة وتستهلك الكثير من الوقت (وبالتالي مدفوعة من عينة صغيرة من المشاركين)» 
فإن الوجه الجديد لتحليل المشاعر القائم على تحليلات النصوص هو كاسر للحد. تعمل الحلول 
الحالية على جعل عمليات جمع البيانات وترشيحها وتصنيفها وتجميعها على نطاق واسع عملية 
آلية. وذلك عبر تقنية الإرمجة معالجة اللغات الطبيعية N1۴‏ وتقنيات التنقيب في البيانات التي 
تتعامل مع كل من المعلومات الواقعية والذاتية. وقد يكون تحليل المشاعر التطبيق الأكثر شيوعًا 
لتحليلات النصوص,» والاستفادة من مصادر البيانات مثل التغريدات» ومشاركات 0kهطاءعه۴م‏ 
والمجتمعات على الإنترنتء ولوحات المناقشةء وسجلات الويب» ومراجعات المنتجات. وسجلات 
مركز الاتصال والتسجيلات» ومواقع تقييم المنتجات. وغرف الدردشة: ومنافذ مقارنة الأسعار 
وسجلات محرك البحث ومجموعات الأخبار. وتهدف التطبيقات التالية لتحليل المشاعر إلى 
توضيح القوة والتغطية الواسعة لهذه التقنية. 

صوت العميل )١©0©0( Jal Dgo aw (VOC)‏ جزءًا Y‏ يتجزأ من أنظمة إدارة علاقات 
العملاء التحليلية 083/4 وأنظمة إدارة العملاء. وباعتبار تحليل المشاعر أداة تمكين ل 5700 
فإنه يمكن لتحليل المشاعر الوصول إلى مراجعات منتجات وخدمات الشركة (سواء بشكل مستمر 
أو بشكل دوري) لفهم وإدارة شكاوى العملاء ومدحهم بشكل أفضل. فعلى سبيل المثال» قد 
تكتشف شركة إعلانات / تسويقء صورًا متحركة أو مشاعر سلبية تجاه فيلم على وشك الافتتاح في 
المسارح (استنادًا إلى مقطوراتها 211615): وتقوم بتغيير تركيبة المقطورات 11211655 وإستراتيجية 
الإعلان بسرعة (على جميع وسائل التواصل) للتخفيف من تأثير السلبية. وبالمثلء يمكن لشركة 
برمجيات أن تكتشف الطنين السلبي فيما يتعلق بالثغرات الموجودة في منتجها الذي تم إطلاقه 
حديثًا في وقت مبكر بما فيه الكفاية؛ لإصدار رقع وتصحيحات سريعة للتخفيف من حدة الموقف. 
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وفي كثير من الأحيان» يكون تركيز صوت العميل (100) على العملاء الأفرادء واحتياجاتهم 
المتعلقة بالخدمات والدعم ورغباتهم ومشكلاتهم. ويقوم ©1106 بتجميع البيانات من ا مجموعة 
الكاملة لنقاط اتصال العملاء ما في ذلك رسائل البريد الإلكتروني والاستطلاعات وتسجيلات مركز 
الاتصال / التسجيلات» وترحيل وسائل التواصل الاجتماعي» ومطابقة أصوات العملاء مع ا معاملات 
(الاستفسارات والمشتريات والعوائد)» والملفات الشخصية للعملاء الفردية التي تم التقاطها في 
مؤسسة أنظمة التشغيل. ويُعد ©1706 والتي يقوم تحليل المشاعر بقيادتهاء عنصرًا أساسيًا في 
مبادرات إدارة تجربة العملاء والذي هثل الهدف في إنشاء علاقة ودية مع العميل. 

صوت السوق (011): يدور 77014 حول فهم الآراء والاتجاهات المجمعة. فهي تتعلق 
معرفة ماهية أصحاب المصلحة - العملاء. العملاء المحتملين» المؤثرينء أيّا كان - بشأن منتجاتك 
وخدماتك (ومنافسيك). ويساعد تحليل 7034 - الذي يتم إجراؤه جيدًا - الشركات على تطوير 
الذكاء التنافسي وتطوير المنتجات ووضعها. 

صوت الموظف (۷0۴): کان ۷0۴ تقليدنًا يقتصر على دراسة رضا الموظفين. وتُّعد تحليلات 
النص بشكل عام (وتحليل المشاعر على وجه الخصوص) تمكينًا كبيرا لتقييم 1701. كما يعد استخدام 
البيانات النصية الغنية المعتمدة على الرأي طريقة فعالة وكفء للاستماع إلى ما يقوله الموظفون. 
وكما Lesar plas‏ فإن الموظفين السعداء يعملون على تمكين جهود تجربة العملاء وتحسين رضاهم. 

إدارة العلامات التجارية: تركز إدارة العلامة التجارية على الاستماع إلى وسائل التواصل 
الاجتماعيء حيث يمكن لأي شخص (العملاء السابقين / الحاليين / المحتملين» وخبراء الصناعة, 
والسلطات الأخرى) نشر الآراء التي يمكن أن تضر بسمعتك أو تعززها. ويقدم عدد من الشركات 
المبتدئة التي تم إطلاقها حديثًا خدمات إدارة العلامات التجارية القائمة على التحليلات للآخرين. 
وتعد إدارة العلامة التجارية هي المنتج» والشركة (بدلًا من العملاء) هي التي تركز عليها. فهي 
تحاول تشكيل المفاهيم بدلا من إدارة الخبرات باستخدام تقنيات تحليل المشاعر. 

الأسواق المالية: كان التنبؤ بالقيم المستقبلية للأفراد (أو مجموعة من الأسهم) مشكلة مثيرة 
للاهتمام ويبدو أنها غير قابلة للحل. وما يجعل السهم (أو مجموعة من الأسهم) يتحرك صعودًا 
أو هبوطًا هو أي شيء غير أنه يتطلب إدراك دقيق. ويعتقد الكثيرون أن سوق الأسهم مدفوعة 
في معظمها بالمشاعرء مما يجعلها غير عقلانية (خاصة بالنسبة لحركات الأسهم قصيرة الأجل). 
ولذلك؛ فقد اكتسب استخدام تحليل المشاعر في الأسواق المالية شعبية كبيرة. ويبدو التحليل الآلي 
طيل السوق باستخدام وسائل التواصل الاجتماعي والأخبار والمدونات ومجموعات النقاش طريقة 
مناسبة لحساب تحركات السوق. فإذا تم ذلك بشكل صحيح. فإنه يمكن أن يحدد تحليل المشاعر 
تحركات الأسهم قصيرة الأجل بناءً على الضجة في السوقء مما قد يؤثر على السيولة والتداول. 
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السياسة: كما نعلم جميعًاء فإن الآراء مهمة للغاية في السياسة. ونظرًا لأن النقاشات السياسية 
تهيمن عليها الاقتباسات والسخرية والإشارات المعقدة للأشخاص والمنظمات والأفكار, فإن السياسة 
هي واحدة من أصعب المجالات التي يمكن أن تكون مثمرة لتحليل المشاعر. ومن خلال تحليل 
المشاعر في المنتديات الانتخابيةء يمكن للمرء أن يتوقع من هو أكثر احتمالًا للفوز أو الخسارة. كما 
يمكن أن يساعد تحليل المشاعر في فهم ما يفكر فيه الناخبون ويمكنه توضيح موقف المرشح بشأن 
القضايا. وبالإضافة إلى ما سبق» فإن تحليل المشاعر يمكنه أن يساعد امنظمات السياسية والحملات 
ومحللي الأخبار على فهم أفضل للقضايا والمواقف الأكثر أهمية بالنسبة للناخبين. وقد تم تطبيق 
التقنية بنجاح من قبل كلا الطرفين في الحملات الانتخابية الرئاسية الأمريكية لعامي "٠١8‏ و17١7.‏ 

المخابرات الحكومية: المخابرات الحكومية هي تطبيق آخر تم استخدامه من قبل وكالات 
المخابرات. فعلى سبيل المثال» تم اقتراح إمكانية مراقبة مصادر الزيادة في الاتصالات العدائية أو 
السلبية. ويمكن لتحليل المشاعر أن يسمح بالتحليل التلقاني للآراء التي يقدمها الأشخاص حول 
مقترحات السياسات أو التنظيم الحكومي المعلقة. وعلاوةً على ذلك. فقد تكون مراقبة الاتصالات 
لاكتشاف ارتفاع المشاعر السلبية مفيدة لوكالات مثل وزارة الأمن الداخلي. 

مجالات أخرى مثيرة للاهتمام: يمكن استخدام مشاعر العملاء لتصميم مواقع التجارة الإلكترونية 
بشكل أفضل (اقتراحات المنتج, الإعلان عن البيع / البيع المتقاطع)» ووضع الإعلانات في مكان أفضل 
(مثل: وضع إعلانات ديناميكية للمنتجات والخدمات التي تنظر في المشاعر في الصفحة التي يقوم 
امستخدم بتصفحها) وإدارة الرأي أو مراجعة محركات البحث ال موجه (أي موقع ويب لتجميع 
الآراءء كبديل لمواقع Epinions Jà‏ وتلخيص ملاحظات المستخدمين). ويمكن أن يساعد تحليل 
المشاعر على تصفية البريد الإلكتروني من خلال تصنيف وترتيب الرسائل حسب أولوياتها (فمثلًا؛ يمكنه 
اكتشاف رسائل البريد الإلكتروني السلبية وإرسالها إلى مجلد مناسب)». بالإضافة إلى تحليل الاقتباس» 
حيث يمكنه تحديد ما إذا كان المؤلف يستشهد بجزء من العمل كدليل دامغ أو بحث مرفوض. 
عملية تحليل المشاعر: 

لا توجد عملية قياسية متاحة بسهولة لإجراء تحليل المشاعرء وذلك بسبب تعقيد المشكلة 
(المفاهيم الأساسيةء التعبيرات في النص السياق الذي يتم فيه التعبير عن النص» إلخ). ومع ذلك 
وبناءً على العمل ال منشور في مجال تحليل الحساسية حتى الآن (على كلٍ من طرق البحث ومجموعة 
التطبيقات)» فإن العملية تبدو متعددة النقاط وبسيطة ومنطقية. وكما هو موضح في الشكل (31-0)» 
والذي هو عبارة عن منهجية مناسبة لتحليل المشاعرء فإن هذه الخطوات المنطقية تكرارية (أي ردود 
الفعل» التصحيحات, التكرارات هي جزء من عملية الاكتشاف) وتجريبية في الطبيعة وجرد الانتهاء 
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من الجمع والتركيب» فإنها تكون قادرة على إنتاج البصيرة المرغوبة حول الآراء في مجموعة النص. 

- الخطوة -١‏ الكشف عن المشاعر: بعد استرجاع الوثائق النصية وإعدادهاء فإن المهمة الرئيسة 
Js‏ في تحليل الحساسية هي الكشف عن الموضوعية. والهدف هنا هو التفريق بين الحقيقة 
والرأي» والتي يمكن اعتبارها تصنيف نصٍ موضوعي أو ذاتي. كما يمكن تمييزها بحساب 5-© 
(الموضوعية o Subjectivity Polarity 4 2e sàsL (3365 - Objectivity‏ هكن مثيلها 
بقيمة رقمية تتراوح من ٠‏ إلى .)١‏ فإذا كانت قيمة الموضوعية قريبة من ١ء‏ فلا يوجد رأي لي 
(أي أنها حقيقة)؛ ولذلك ترجع العملية وتستخرج البيانات التالية للنص لتحليلها. fole‏ ما 
يستند اكتشاف الرأي على دراسة الصفات في النص. فعلى سبيل المثال» يمكن تحديد تناقض ”ما 
يعد "lily Nae‏ بسهولة نسبية بالنظر إلى الصفة. 

- الخطوة -١‏ تصنيف التناقض 71-8: المهمة الرئيسة الثانية هي تصنيف التناقض. وبالنظر إلى 
نص معين برأي quia‏ فإن الهدف هو تصنيف الرأي على أنه يندرج تحت إحدى عاطفتين 
متعارضتين, أو تحديد موقعه على الدوام بين هاتين المتناقضتين (2008 disd .(Pang & Lee,‏ 
النظر إليه على أنه عنصر ثنائ» فإن تصنيف الأقطاب هو مهمة التصنيف الثنائي لوضع علامة 
على وثيقة الرأي كإعراب إما عن رأي إيجابي شامل أو سلبي شامل (مثل: الإعجاب أو الإبهام). 
وبالإضافة إلى تحديد تناقض 21-5 فإنه يجب أيضًا أن يكون المرء مهتمًا بتحديد قوة المشاعر 
(على عكس الإيجابي فقطء قد يتم التعبير عنه mildly Lzh go JÍ 3 ie‏ أو معتدل 
")هلهم أو قويء أو إيجابي للغاية). وقد تم إجراء معظم هذا البحث حول مراجعات 
المنتجات أو الأفلام حيث تكون تعريفات ”الإيجابية“ و“السلبية“ واضحة تمامًا. وهناك بعض 
المهام الأخرى» مثل تصنيف الأخبار على أنها “جيدة“ أو ”سيئة“. فعلى سبيل المثال. قد تحتوي 
إحدى المقالات على أخبار سلبية بدون استخدام أي كلمات أو عبارات ذاتية بشكل صريح. 
علاوةً على ذلك تظهر هذه الفئات عادةً مختلطة عندما تعبر الوثيقة عن المشاعر الإيجابية 
والسلبية. cades‏ فإن هذه المهمة يمكنها تحديد المشاعر الرئيسة (أو المسيطرة) للوثيقة. 
ومع ذلك فإنه بالنسبة للنصوص المطولة» قد يلزم القيام بمهام التصنيف على عدة مستويات: 
المصطلح. العبارة» الجملة» ورها مستوى الوثيقة. وبالنسبة لهؤلاء فإنه من الشائع استخدام 
مخرجات مستوى واحد كمدخلات للطبقة الأعلى التالية. وفي القسم التالي سوف نتناول شرح 
العديد من الطرق المستخدمة لتحديد التناقض وكذلك أوجه القوة في التناقض. 

- الخطوة *- تحديد الهدف: الهدف من هذه الخطوة هو تحديد هدف المشاعر fld‏ عنها بدقة 
ule)‏ سبيل اللثال: شخصء منتج, حدث). وتعتمد صعوبة هذه المهمة بشكل كبير على مجال 
التحليل. وعلى الرغم من أنه من السهل عادةً تحديد الهدف بدقة لمراجعات المنتج أو الفيلم 
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نظرًا لأن المراجعة مرتبطة مباشرة بالهدفء فقد يكون الأمر صعبًا جدًا في النطاقات الأخرى. فعلى 
سبيل المثال» لا يحتوي النص طويل الأمده مثل صفحات الويب وامقالات الإخبارية والمدؤنات دايا 
على موضوع محدد مسبقًا تم تعيبنه» وكثيرا ما يذكر العديد من الموضوعات. والتي يمكن استنتاج 
أي منها على أنه الهدف. وفي بعض الأحيان يكون هناك أكتر من هدف واحد في جملة المشاعر. 
وهذا هو الحال في النصوص المقارنة؛ حيث تقوم جملة نسبية ذاتية بطلب الأشياء حسب ترتيب 
التفضيل - مثل: “هذا الحاسب المحمول أفضل من الحاسب المكتبي الخاص بي". ويمكن تحديد 
هذه الجمل باستخدام الصفات والحالات المقارنة (أكثرء أقلء أفضلء أطول)» والصفات الفائقة 
(معظم» والأقل والأفضل)ء وغيرها من الكلمات (مثل: نفس الشيء. (LÉS J ailih‏ وبمجرد 
استرداد الجملء يمكن وضع الأشياء بترتيب أكثر تمثيلًا لمزاياهاء كما هو موضح في النص. 

- الخطوة 6- الجمع والتجميع: بمجرد تحديد ومعالجة مشاعر جميع نقاط البيانات النصية في 
الوثيقة. يتم تجميعها وتحويلها في هذه الخطوة إلى قياس واحد لكل الوثيقة. وقد يكون هذا 
التجميع بسيطًا مثل تلخيص نقاط الضعف ونقاط القوة لكل النصوصء أو معقدًا مثل استخدام 
تقنيات التجميع الدلالي من معالجة اللغات الطبيعية N1۴‏ للوصول إلى ا مشاعر النهائية. 
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طرق تحديد التناقض: 
كما ذكرنا في القتسم السابقء يمكن تحديد التناقض على مستوى الكلمة أو العبارة أو الجملة 
أو الوثيقة. ويُعد المستوى الأكثر دقة لتحديد التناقض هو على مستوى الكلمة. وبمجرد أن يتم 
تحديد التناقض على مستوى الكلمة» فإنه يمكن ضمها إلى المستوى الأعلى التاليء ثم إلى ا مستوى 
التالي حتى يتم الوصول إلى مستوى التجميع المطلوب من تحليل المشاعر. ويبدو أن هناك تقنيتين 
سائدتين تُستخدمان لتحديد التناقض على مستوى الكلمة / المصطلح ولكل منهما مميزاته وعيوبه: 
-١‏ استخدام المعجم كمكتبة مرجعية (ويتم تطويره إما يدويًا أو تلقائيّه بواسطة فرد لمهمة 
محددة أو قد يتم تطويره بواسطة مؤسسة للاستخدام العام). 
-١‏ استخدام مجموعة من وثائق التدريب كمصدر للمعرفة حول تناقض المصطلحات في نطاق 
معين (أي استحداث نماذج تنبؤية من الوثائق النصية المعترف بها). 


استخدام المعجم: 

المعجم هو في الأساس كتالوج لكلمات لغة معينة ومرادفاتها ومعانيها. وهناك العديد من 
ا معاجم ذات الأغراض العامة التي تم إنشاؤها للغة الإنجليزية» بالإضافة إلى وجود معاجم للعديد 
من اللغات الأخرى. وتستخدم معاجم الأغراض العامة في الغالب لإنشاء مجموعة متنوعة من 
المعاجم ذات الأغراض الخاصة لاستخدامها في مشاريع تحليل المشاعر. ولعل المعجم الأكثر 
انتشارًا للأغراض العامة هو 580071766 Princeton à. sle (à e5L 25] e ($.Uls‏ والذي تم 
توسعته واستخدامه من قبل العديد من الباحثين والممارسين لأغراض تحليل المشاعر. وكما هو 
موضح في موقع ]1801071 على الويب (ننلء.0م]ععص لهم .أعصل10): فهو قاعدة معجمية كبيرة 
للغة الإنجليزية: بما في ذلك الأسماء والأفعال والصفات والظروفء والتي تم ضمها في مجموعات 
من المرادفات اللقربة (ويطلق عليها 5ء5ر8). والتي يعبر كل منها عن مفهوم متميز. وتترابط 
55 عن طريق وسائل مفاهيمية دلالية وعلاقات معجمية. 

وقد تم إنشاء ملحق مثير للاهتمام لمعجم ]1801011 بواسطة ذلناوظ وتسهتامدء5 )2006( 
حيث قاما بإضافة تناقض (إيجابي - سلبي؛ 8-11) وموضوعية (ذاتي - موضوعي؛ JSI (S-O‏ 
مصطلح في المعجم. ولتسمية كل مصطلح. يقومان بتصنيف المجموعة من اللمترادفات التي ينتمي 
إليها هذا المصطلح باستخدام مجموعة ثلاثية التصنيف (وهي مقياس يربط كل موضوع BLE‏ 
واحدًا من ثلاثة عناوين)؛ وكل واحد منهم قادر على تقرير ما إذا كانت )57056 إيجابية أم سلبية 
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أم موضوعية. وتتراوح الدرجات الناتجة من ٠,١‏ إلى ds‏ مما يعطي تقبيمًا متدرجًا لخصائص 
المصطلحات المتعلقة بالرأي. ويمكن تلخيصها بصورة مرئية كما في الشكل .)٠١-0(‏ وتمثل أضلاع 
المثلث التصنيفات الثلاثة (الإيجابية والسلبية والموضوعية). ويمكن أن يتم تحديد موقع المصطلح 
في هذه المساحة كنقطة. تمثل المدى الذي ينتمي إليه كل واحد من هذه التصنيفات. 


ويتم استخدام منهجية توسيع مماثلة لإنشاء 2581118050116 وهو معجم متاح للجمهور 
تم تطويره خصيصًا لأغراض التنقيب في الرأي (تحليل المشاعر). وَيُّعيّن SentiWordNet‏ لكل 
مجموعة من الدرجات الثلاث من معنويات 7870107166: الإيجابية والسلبية والموضوعية. ويمكن 
الاطلاع على المزيد -sentiwordnet.isti.cnr.it à SentiWordNet Js»‏ 


وهناك ملحق آخر .WordNet-Affect ga WordNet J‏ وقد تم تطويره بواسطة كل من 
Valituttis Strapparava‏ )2004( حيث قاما بتصنيف معادلات 11/007166 باستخدام تسميات 
فعالة تمثل فئات عاطفية مختلفة مثل العاطفة والحالة الإدراكية والموقف والشعور. كما استخدما 
WordNet‏ أيضًا بشكل مباشر في تحليل المشاعر. فمثلا. Hovys Kim ġe JS pë‏ )2004( و 
ezlza 55h32 (2005) Chengs Hus Liu‏ للمصطلحات الإيجابية والسلبية من خلال البدء 
بقانئمة صغيرة من مصطلحات ”البذور“ للمترادفات المتعارف عليها (مثل: 107 ,ع»111 166ه) وبعد 

ذلك استخدما خاصيتي تضاد وترادف المصطلحات لتجميعها في أي فئة من فئات التناقض. 
(S) i5‏ 














شكل :٠١-0‏ تمثيل بياني لعلاقتي تناقض كل من 2-727 و5-0 


استخدام مجموعة من وثائق التدريب: 
من الممكن إجراء تصنيف للمشاعر باستخدام التحليل الإحصائي وأدوات التعليم الآلي التي 
تتمتع بميزة كمية الموارد الضخمة من الوثائق المتاحة (يدويًا عن طريق الحواشي أو باستخدام 
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نظام نجمة / نقطة). وقد تم استخدام مواقع الويب مثل 78208ضف و0-1181.: وتردظء» و 
Je Internet Movie Databases .RottenTomatoes‏ نطاق واسع كمصادر للبيانات المشروحة. 
من أجل استعراض المنتجات. ويوفر نظام النجمة (أو الطماطم سابقًا) علامة واضحة عن التناقض 
الكامل في الاستعراض ككلء وغالبًا ما يتم استخدامه كمعيار ذهبي لتقييم الخوارزمية. 
وتنوفر مجموعة متنوعة من البيانات النصية المصنفة يدويًا من خلال جهود التقييم مثل مؤتمر 
N11 Test Collectiong RETRIETER‏ لأنظمة 1۸ وعبر منتدى تقييم اللغات. وتنتج هذه 
المجموعة من البيانات جهودًا ls UU‏ تكون هثابة معيار في مجتمع التنقيب في النص» ها في ذلك 
لباحثي تحليل المشاعر. كما أنتج الباحثون الفرديون ومجموعات البحث العديد من مجموعات 
البيانات المثيرة. وتعرض الفكرة التطبيقية (0-؟) قائمة ببعضها. وبمجرد الحصول على مجموعة 
بيانات نصية مصنفة بالفعلء فإنه يمكن استخدام مجموعة متنوعة من النمذجة التنبؤية وغيرها 
من خوارزميات تعلم الآلة لتدريب مصنفي المعنويات. وتتضمن بعض الخوارزميات الأكثر شيوعًا 
المستخدمة لهذه المهمة الشبكات العصبية الاصطناعية» وآلة المتجهات الداعمة» والجار الأقرب» 
والخلايا البسيطة. وأشجار القرارء وتعظيم التقديرات على أساس المجموعة. 
رؤية فنية ۲-٠‏ 
مجموعات بيانات نصية كبيرة للتنقيب التنبؤي في النص وتحليل المشاعر 
:Floor-Debate Jg> w395] yoga‏ نشرها كل من 1502285, Leeg Pangg‏ 
(2006)؛ وتحتوي على خطابات سياسية تم تصنيفها لتوضيح ما إذا كان المتحدث يدعم 
أو يعارض التشريع الذي تمت مناقشته. 
همه : نشرتها مدرسة 56628 في جامعة نيويوركء وتتكون من تعقيبات 
التجار Amazon.com (à‏ 
مجموعات بيانات عرض الأفلام من (Lee 2008) g Pang JS Lgosō 435 :Cornell‏ 
وتحتوي على ٠٠٠١‏ تصنيف إيجابي و١٠٠٠‏ تصنيف تلقائي سلبي مشتقة من عناوين مستوى 
الوثيقة و١0۳۴‏ جملة / olas‏ إيجابية و١0۳۳‏ جملة / قصاصة سلبية. 
ستانفورد - مجموعة كبيرة لعرض الأفلام: وهي مجموعة من ۲٠٠٠١‏ فيلم شديدة 
التناقض تتم مراجعتها للتدريب و٠٠٠۲‏ للاختبار. ويوجد بيانات إضافية للاستخدام 
بدون عنوان. كما يتم توفير تنسيقات للنصوص الخام وحقائب الكلمات ا معالجة 
(http://ai.stanford.edu/-amaas/data/sentiment : Jl) I‏ 
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مجموعة :5۲Q۸‏ تحتوي المجموعة ونظام استطلاع Gb] Uis ovo (e (sl JI‏ 
مشروحة يدويًاً من مجموعة متنوعة من مصادر الأخبار التي تحتوي على عناوين للأراء 
والتصريحات الخاصة (المعتقدات, العواطفه المضاربات» إلخ). 

عروض مطاعم متعددة الجوانب: وقام بعرضها كل من Snyder‏ وBarzilay‏ (2007) 
وتحتوي على 6618 مراجعة مع تقييم صريح من ١‏ إلى 0 لخمسة جوانب مختلفة: الطعام 
والجو والخدمة والقيمة بالإضافة إلى الخبرة العامة. 


تحديد الاتجاه الدلالي للجمل والعبارات: 

هجرد تحديد الاتجاه الدلالي للكلمات الفردية» فمن المستحسن في كثير من الأحيان تمديد 
ذلك إلى العبارة أو الجملة التي تظهر بها الكلمة. وأبسط طريقة لتحقيق هذا التجميع هي 
استخدام نوع من المتوسط لاستقطاب الكلمات في العبارات أو الجمل. وعلى الرغم من أنه نادرًا 
ما يتم تطبيقه. إلا أن هذا التجميع يمكن أن يكون معقدًا مثل استخدام واحد أو أكثر من تقنيات 
تعلم الآلة لإنشاء علاقة تنبؤية بين الكلمات (وقيم تناقضها) والعبارات أو الجمل. 


تحديد الاتجاه الدلالي للوثائق: 

على الرغم من أن الغالبية العظمى من العمل في هذا المجال تتم في تحديد التوجه الدلالي للكلمات 
والعبارات / الجملء فإن بعض المهام مثل التلخيص واسترجاع المعلومات قد تتطلب وضع العلامات 
الدلالية للوثيقة بأكملها (©82:028 وآخرونء 5 (Y‏ ويتم أيضًَا تحقيق التجميع إلى مستوى الوثيقة 
بواسطة نوع من المتوسطء على غرار الحالة في تجميع تناقض المشاعر من مستوى الكلمة إلى مستوى 
شبه الجملة أو الجملة. وقد لا يكون اتجاه المشاعر للوثيقة منطقيًا للوثائق الكبيرة جدًا؛ «d Js‏ 
فغالبًا ما يتم استخدامه على الوثائق الصغيرة إلى متوسطة الحجم المنشورة على الإنترنت. 


أسئلة مراجعة على القسم 5-0: 

-١‏ ما هو تحليل المشاعر؟ وكيف يرتبط بالتنقيب في النص؟ 

۲- ما هي مجالات التطبيق الأكثر انتشارًا لتحليل ا مشاعر؟ lbg‏ 

*- ما هي الفوائد المتوقعة والمستفادة من تحليل المشاعر في السياسة؟ 
-٤‏ ما هي الخطوات الرئيسة في تنفيذ مشاريع تحليل المشاعر؟ 

-٥‏ ما هما الطريقتان الشائعتان لتحديد التناقض؟ اشرح. 
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äle öbs v-o‏ على التنقيب في الويب: 

لقد غيرت شبكة الإنترنت خطوات إجراءات الأعمال إلى الأبد. ونظرًا لكون العام الآن Xaza‏ 
ببعضه البعض ومترابطًا بشكل كبير وأيضًا لاتساع مجال المنافسة. تواجه الشركات اليوم بشكل متزايد 
فرصا أكبر (وهي القدرة على الوصول إلى عملاء وأسواق م يكن يُعتقد من قبل إمكانية الوصول 
إليها) وتحديات أكبر (أي السوق التنافسي المعوم والمتغير باستمرار). فالأفراد الذين يتمتعون برؤية 
وقدرات للتعامل مع مثل هذه البيئة المتقلبة يستفيدون منها بشكل كبيرء في حين يواجه غيرهم 
ممن يكرهون التغيير صعوبة في البقاء في السوق. وم يعد الدخول على شبكة الإنترنت الآن خيارًا 
كماليّه فقد أصبح أحد متطلبات العمل الآن. فالعملاء ينتظرون استلام المنتجات / الخدمات من 
الشركات عبر الإنترنت. ولا يتوقف الأمر على الشراء فحس ب فهم أيضًا يشاركون مع أصدقائهم 
تجاربهم ومعاملاتهم التي تتم مع الشركات. 

لقد أدى النمو المتسارع في الإنترنت وتقنياته التمكينية إلى تسهيل عمليات إنشاء وجمع 
البيانات وتبادل البيانات / ا معلومات / الآراء. كما أن التأخيرات في الخدمة وعمليات التصنيع 
والشحن والتسليم واستعلامات العملاء لم تعد اليوم حوادث خاصة ويتم استقبالها والتعامل 
معها باعتبارها أمورًا ضرورية. فالشركات الناجحة هي التي تتبنّى تقنيات الإنترنت الحديثة فور 
ظهروه ا وتطوعها من أجل تحسين عملياتها التجارية بحيث مكنها التواصل بشكل أفضل مع 
عملائها وفهم احتياجاتهم ورغباتهم وخدمتهم بشكل كامل وسريع. فلم يكن إطلاقًا التركيز على 
العملاء والحفاظ على مستوى رضاهم مفهومًا مهما للشركات كما هو في عصر الإنترنت ووسائل 
التواصل الاجتماعي التي نعيشها اليوم. 

تعتبر شبكة الإنترنت بمثابة مستودع ضخم للبيانات والمعلومات حول كل شيء يمكن أن يتصوره 
أي أحد. على سبيل JULI‏ لا الحصرء الأعمال التجارية» الأبحاث والنظريات العلمية, مقالات في شتى 
المجالات» وبكميات وفيرة. وبذلك فربما تكون شبكة الويب هي أكبر مستودع للبيانات والنصوص 
في العام ويتزايد حجم المعلومات على الويب بسرعة» مما هكن أي باحث من العثور على الكثير 
من المعلومات اللثيرة لاهتمامه والوصول إلى صفحتها الرئيسية والصفحات الأخرى المرتبطة dg‏ 
وكذلك إلى الأشخاص الذين لديهم روابط إلى تلك الصفحة. وبالإضافة إلى ذلك يقوم كل زائر لأي 
موقع ويب وكل بحث على أي محرك بحث وكل نقرة على أي رابط وكل معاملة على أي موقع 
للتجارة الإلكترونية بإنشاء بيانات إضافية. وعلى الرغم من أن البيانات النصية غير المهيكلة في شكل 
صفحات الويب والمكتوبة بلغة ,111341 أو :7301 هي المحتوى المهيمن على الويب» فإن البنية 
التحتية للویب تتضمن معلومات ارتباط 23 5( (J| 1s) hyperlink information‏ صفحات 
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ويب أخرى) ومعلومات الاستخدام (سجلات تفاعلات الزوار مع مواقع الويب) وكلها توفر بيانات 
غنية لاكتشاف المعرقة. كما يمكن أن يساعدنا تحليل هذه المعلومات في تحسين استخدام مواقع 
الويب وكذلك مساعدتنا في تعزيز العلاقات والقيمة لزوار مواقعنا الخاصة. 
نخلص مما سبق إلى أن شبكة الإنترنت تتمتع بحجم هائل ومعقد.ء مما يجعل التنقيب في 
الويب ليس مهمةٌ سهلةٌ بأي وسيلة من الوسائل. كما تشكل الويب أيضًَا تحديات كبيرة لاكتشاف 
فعال وكفء للمعرفة )2006 :(Han & Kanber,‏ 
- شبكة الويب كبيرة جدًا للتنقيب JEA‏ عن البيانات: إن شبكة الإنترنت كبيرة جدًا ومتنامية بسرعة 
بحيث يصعب حتى قياس حجمها. ولذا؛ فليس من الممكن إنشاء مستودع بيانات لتكرار وتخزين 
ودمج جميع البيانات على الويب» مما يجعل جمع البيانات وتكاملها أمرًّا غاية في الصعوبة. 
- الويب معقدٌ للغاية: يعتبر تعقيد صفحة الويب أكبر بكثير منه لصفحة في مجموعة وثائق نصية 
تقليدية. وتفتقر صفحات الويب إلى بنية موحدة؛ فهي تحتوي على أنماط للتأليف ومحتوى 
كبر بكثير من أي مجموعة من الكتب أو المقالات أو غيرها من الوثائق النصية التقليدية. 
- الويب حيويٌّ جدًا: يعتبر الويب مصدرًا للمعلومات مفعمًا بالحيوية لأبعد الحدود. ولا ينمو 
لويب بسرعة» بل يتم تحديث محتواه باستمرار؛ إذ يتم تحديث المدونات والقصص الإخبارية 
ونتائج أسواق الأسهم وتقارير الطقس والنتائج الرياضية والأسعار وإعلانات الشركات وأنواع 
خرى من المعلومات بشكل منتظم على الويب. 
- شبكة الويب ليست خاصة جال ما: تخدم الويب مجموعة كبيرة من المجتمعات كما تقوم 
بربط المليارات من محطات العمل. يتمتع مستخدمو الويب بخلفيات واهتمامات وأغراض 
استخدام مختلفة تمامًا. كما قد لا يكون لدى معظم المستخدمين معرفة جيدة بهيكل شبكة 
المعلومات أو قد لا يكونون على دراية بالتكلفة الباهظة لعملية بحث معينة يقومون بها. 
- الويب يحتوي على كل شيء: يعتبر جزء صغير فقط من المعلومات الموجودة على الويب ذا صلة 
أو مفيد لشخص ما (أو بلهمة ما). يقال إن ٩٩‏ من اللعلومات على الويب لا فائدة منها ل 35 
من مستخدمي الإنترنت. وعلى الرغم من أن هذا قد لا يبدو واضحًاء إلا أن شخصًا ما قد يهتم 
بجزء صغير فقط من الويبء بينما تحتوي بقية الويب على معلومات يراها غير مهمة بالنسبة 
له وهي قد تؤدي إلى النتائج المرجوة؛ إذ يعتبر العثور على جزء من الويب ذي صلة حقيقية 
بشخص ما والمهمة التي يقوم بتنفيذها مسألة شائكة فيما يخص البحث المتعلق بالويب. 
دفعت كل هذه التحديات العديد من الجهود البحثية لتعزيز فعالية وكفاءة اكتشاف 
واستخدام أصول البيانات على شبكة الإنترنت» حيث يقوم عدد من محركات البحث على الويب 
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القائمة على الفهرسة بالبحث باستمرار في الويب وتقوم بفهرسة صفحات الويب تحت كلمات 
رئيسية معينة. وباستخدام هذه المحركات قد يتمكن مستخدم متمرس من تحديد موقع الوثائق 
من خلال توفير مجموعة من الكلمات المفتاحية أو العبارات المقيدة بإحكام. ومع ذلك فإن أي 
محرك بحث بسيط يعتمد فقط على الكلمات ال مفتاحية قد يواجه بعض المشكلات» منها: 


-١‏ يمكن لأي موضوع معروض للبحث أن يحتوي بسهولة على مئات أو آلاف الوثائق. ويمكن 
أن يؤدي ذلك إلى عدد كبير من المدخلات ذات صلة هامشية بالموضوع والتي يتم إرجاعها 
بواسطة محرك البحث. 

Y 28 -Y‏ تحتوي العديد من الوثائق ذات الصلة الكبيرة با موضوع محل البحث على كلمات رئيسة 
دقيقة لتحددها. 
كما سنقوم بتغطية أكثر تفصيلًا لاحقًا في هذا الفصل» مقارنة بالبحث على الويب القائم على 

الكلمات المفتاحية. يُعد التنقيب في الويب أحد الأساليب البارزة (والأكثر تحديًا) التي يمكن 

استخدامها لتعزيز قوة محركات البحث على الويب بشكل كبير؛ لأن التنقيب في الويب يمكنه 
تحديد صفحات الويب» وتصنيف وثائق الويب. وحل العديد من الغموض والخواطر التي يتم 

جمعها في محركات البحث القائمة على الكلمات المفتاحية. 
يعرف التنقيب في الويب (أو التنقيب في بيانات الويب) بأنه عملية اكتشاف العلاقات 

الجوهرية (أي المعلومات المثيرة للاهتمام والمفيدة) من بيانات الويبء والتي يتم التعبير عنها في 

شكل معلومات نصية أو ارتباطية أو معلومات الاستخدام. وقد تم استخدام مصطلح التنقيب 

Web mining c. 39Jl à‏ لأول مرة بواسطة (1996) 1ه8]210؛ وتركز اليوم العديد من المؤتمرات 

والمجلات والكتب على التنقيب في بيانات الويب. إنه مجال متطور باستمرار من التقنية والممارسات 

التجارية. ويعتبر التنقيب على الويب في الأساس نفس عملية التنقيب في البيانات التي تستخدم 
البيانات التي يتم توليدها عبر الويب. ويكون الهدف من ذلك هو تحويل مستودعات واسعة من 
المعاملات التجارية وتفاعلات العملاء وبيانات استخدام موقع الويب إلى معلومات قابلة للتطبيق 
(أي المعرفة) وذلك لتشجيع اتخاذ قرارات أفضل في جميع أنحاء المؤسسة. وبسبب زيادة انتشار 
مصطلح التحليلات» شرع الكثيرون في الوقت الحاضر في الرجوع إلى التنقيب على شبكة الإنترنت 
وتحليلات الويب. ومع ذلككء لا يعتبر هذان المصطلحان شيئًا واحدًا. وفي حين تعد تحليلات الويب 
في المقام الأول هي بيانات استخدام موقع الويب» فإن التنقيب على الويب يشمل جميع البيانات 
التي يتم توليدها عبر الإنترنت بما في ذلك بيانات المعاملات الاجتماعية وبيانات الاستخدام. وحيث 


للك ذكاء الأعمال والتحليلات OBLI pleg‏ منظور إداري 


التحليلات التنبؤية (؟): تحليلات النص والويب ووسائل التواصل الاجتماعي 


تستهدف تحليلات الويب وصف ما حدث على موقع الويب (باستخدام منهجية تحليلية وصفية 
مبنية على مقاييس ومحددة مسبقًا). يهدف التنقيب في الويب إلى اكتشاف أنماط وعلاقات غير 
معروفة من قبل (باستخدام منهجية تحليلية جديدة للتنبؤ أو منهجية توجيهية). ومن منظور 
أكثر اتساعًاء يمكن اعتبار تحليلات الويب جزءً! من التنقيب في الويب. ويعرض الشكل )١١-0(‏ 
s a usas‏ للتتنقيب على الويب» حيث يتم تقس يمه إلى ثلاثة مجالات رئيسة هي: التنقيب 
في محتوى الويب والتنقيب في بنية الويب والتنقيب باستخدام الويب. وفي هذا الشكل أيضّا 
يتم تحديد مصادر البيانات المستخدمة في هذه المناطق الرئيسة الثلاثة. وعلى الرغم من أن هذه 
المجالات الثلاثة تظهر بشكل منفصلء كما سنرى في القسم التالي من هذا الفصلء إلا أنها غالبًا ما 
تُستخدم بشكل جماعي وتكاملي لمعالجة مشكلات وفرص الأنشطة التجارية. 





| التتقيب فى | التنقيب | | 
j‏ القص QOEM‏ 


التنقيب فى الويب 


التنقيب فى استخدام الويب التنقيب فى هيكل الويب التنقيب فى محتوى الويب 








تحليل مرونة الويب [[ تحليلات رسائل التواصل الاجتماعى تحليل الشبكة الإجتماعية J|‏ تحسين محرك البحث | 
[ _صوت العميل |[ . رأى العميل 360 ][ تحليلات العملاء |[ إسناد التسويق __ | 

















شكل :1١-0‏ تصنيف مبسط للتنقيب في الويب 

وكما يوضح الشكل .)1١-0(‏ يعتمد التنقيب على الويب بشكل كبير على التنقيب في البيانات 
واستخراج النصوص وأدواتها وتقنياتها التمكينية. والتي قمنا بتغطيتها بالتفصيل في وقت مبكر من 
هذا الفصل وفي الفصل السابق (الفصل 6). ويشير هذا الشكل أيضًا إلى أن هذه المناطق العامة 
الثلاثة تمتد إلى العديد من مناطق التطبيق المعروفة جيدًا. وقد تم شرح بعض هذه المجالات في 
الفصول السابقة. وسيتم تغطية بعض الجوانب الأخرى بالتفصيل في هذا الفصل. 
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التنقيب في محتوى الويب وهيكل الويب: 

يشير مصطلح التنقيب في محتوى الويب إلى استخراج ال معلومات المفيدة من صفحات الويب؛ 
حيث يتم استخراج الوثائق بتنسيق يكن قراءته آليّا حتى تتمكن التقنيات الآلية من استخلاص 
بعض المعلومات من صفحات الویب هذه. کما یتم استخدام برامج زواحف الویب Web crawlers‏ 
(ويُطلق عليها أيضًا العناكب 5010675) لقراءة محتوى موقع الويب تلقائيًا. وقد تتضمن المعلومات 
التي تم تجميعها خصائص وثائقية مشابهة لما يتم استخدامه في التنقيب في النصء ولكنها قد 
تتضمن أيضًا مفاهيم إضافيةء مثل التسلسل الهرمي للوثائق. ويمكن استخدام عملية الجمع الآلي 
(أو شبه الآلي) لمحتوى الويب والتنقيب فيه للحصول على معلومات ذكاءية تنافسية (بما يعني 
جمع المعلومات المتعلقة بالمنافسين ومنتجاتهم وخدماتهم التي يقدمونها وعملائهم). كما يمكن 
استخدامه أيضًا لجمع المعلومات / الأخبار / الآراء وتلخيصها وتحليل المشاعر والجمع التلقائي 
للبيانات وتنظيمها من أجل النمذجة التنبؤية. وكمثال توضيحي لاستخدام التنقيب في محتوى 
الويب كأداة لجمع البيانات بطريقة آليةء دعنا نأخذ في الاعتبار ما يلي: منذ أكثر من ٠١‏ سنوات» 
قام كل من دكتور 508103 و1216 بتطوير نماذج للتنبؤ بالنجاح اللالي لأفلام هوليوود قبل إصدارها 
المسرحي؛ حيث تأني البيانات التي يستخدمونها لتدريب النماذج من عدة مواقع على الويب» لكل 
منها بنية صفحة هرمية مختلفة. والجدير بالذكر أن عملية جمع مجموعة كبيرة من المتغيرات على 
آلاف الأفلام (من عدة سنوات سابقة) من مواقع الويب عملية تتطلب الكثير من الوقت وكذلك 
عرضة للخطأ. ولذلك؛ فهي تستخدم التنقيب في محتوى الويب والعناكب 5010625 باعتبارها تقنية 
تمكينية لجمع واختبار صحة وصلاحية وتخزين هذه القيم في قاعدة بيانات علائقية. (وفيما يخص 
اختبار الصحة والصلاحية؛ فإذا كان عنصر البيانات المحدد متاخًا على أكثر من موقع ويب واحده 
عندئذ يتم التحقق من صحة القيم ضد بعضها البعض ويتم التقاط وتسجيل الانحرافات). وبذلك 
فهي تضمن جودة البيانات مع توفير وقت العملية الثمين (أيام أو أسابيع). 

وبالإضافة إلى احتوائها على النصوص, تحتوي صفحات الويب أيضًا على روابط تشعبية 
تشير صفحة واحدة إلى أخرى hyperlinks‏ إذ تحتوي الروابط التشعبية على قدر كبير من 
التعليقات التوضيحية البشرية المخفاة التي يمكن أن تساعد في الاستنتاج التلقائي لمفهوم المركزية 
أو السلطة. وعندما تشتمل صفحة ويب على رابط يشير إلى صفحة ويب أخرى» فيمكن اعتبار 
ذلك مثابة موافقة المطوّر على الصفحة الأخرى. وقد يشير التأييد الجماعي لصفحة معينة 
على الويب من قبل مطوّرين مختلفين إلى أهمية تلك الصفحة. وقد يؤدي ذلك بشكلٍ طبيعي 
إلى اكتشاف عدة صفحات ويب موثوقة (2005 ,3011165). لذلك؛ فإن وجود كمية هائلة 
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من المعلومات المترابطة عبر الإنترنت يوفر مجموعة غنية من المعلومات حول مدى ملاءمة 

محتويات الويب وجودتها وهيكلهاء وتعتبر بالتالي مصدرًا غنيًّا للتنقيب في الويب. 
كما يمكن استخدام التنقيب في محتوى الويب لتعزيز النتائج التي تنتجها محركات البحث. 

وفي الواقع» قد يكون البحث هو التطبيق الأكثر انتشارًا للتنقيب في محتوى الويب وتعديل بنية 

الويب. وعادةٌ ما يقودنا البحث على الويب الذي يتم بغرض الحصول على معلومات حول 
موضوع معين (والذي يتم تقدهه كجملة أو مجموعة كلمات مفتاحية) إلى بضع صفحات ويب 
ذات صلة بالموضوع محل البحثء وتكون ذات جودة عالية ja SÍ ose JI Léig‏ صفحات 
الويب غير القابلة للاستخدام. ويؤدي استخدام الفهرس المتعلق بالموضوع محل البحث استنادًا 
إلى الكلمات اللفتاحية والصفحات الرسمية (أو بعض مقاييسها) إلى تحسين نتائج البحث وترتيب 
الصفحات ذات الصلة. وتنبع فكرة المسؤولية الفكرية (أو الصفحات الموثوقة) من استرجاع 
المعلومات سابقة النشر باستخدام اقتباسات من مقالات المجلات لتقييم تأثير الأوراق البحثية 

eba (Miller, 2005)‏ من أن هذا هو أصل الفكرة إلا أن هناك اختلافات معنوية بين 

الاقتباسات في المقالات البحثية والروابط التشعبية ءk«ناإءم‏ رط على صفحات الويب وهي: 

-١‏ لا يمثل كل رابط تشعبي مصادقة أو موافقة (فبعض هذه الروابط يتم إنشاؤه لأغراض التصفح 
وبعضها للإعلانات المدفوعة). وعلى الرغم من أن هذا صحيح. إذا كانت غالبية الارتباطات 
التشعبية من نوع المصادقة. فسيظل الرأي الجماعي سائدًا. 

؟- بالنسبة للحالات التجارية والتنافسية: نادرًا ما ستشير إحدى الإدارات على صفحتها على الإنترنت 
إلى الصفحات المنافسة لها في نفس المجال. فعلى سبيل المثال قد لا تفضل Microsoft‏ 
تضمين روابط على صفحات الويب الخاصة بها تشير إلى المواقع الخاصة بشركة ءاممهة؛ لأن 
هذا قد يعتبر بمثابة تصديق على سلطة منافسها. 

- نادرًا ما تكون الصفحات الموثوقة وصفية بشكل خاص. فمثلًاه قد لا تحتوي صفحة ومطقلا 
الرئيسية على وصف ذاتي صريح بأنه في الواقع محرك بحث. 
وقد أفرز هيكل الروابط التشعبية على الويب تصنيقًا آخر مهما لصفحات الويب يسمى 

المحور انال وهو واحد أو أكثر من صفحات الويب التي توفر مجموعة من الروابط المشيرة إلى 

صفحات موثوقة أخرى. وقد لا تكون المحاور بارزة» Las‏ قد يشار إليها بروابط قليلة جا 
ومع ذلك فإنها توفر روابط تشير إلى مجموعة من المواقع البارزة حول الموضوع محل الاهتمام 
أو الدراسة. وقد يكون المحور عبارة عن قائمة بالروابط الموصى بها على الصفحات الشخصية: أو 
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قائمة بالمواقع المرجعية امقترحة على صفحة الويب الخاصة بدورة تدريبية ماء أو قائمة موارد تم 
تجميعها بشكل احترافي حول موضوع محدد. كما تلعب ا محاور دورًا ضمنيًا في الحد من اتساع 
نطاق السلطات. وجوهريًاء توجد علاقة تكافلية وثيقة بين المحاور الجيدة والصفحات الموثوقة؛ 
فال محاور الجيدة تكون جيدة لأنها تشير إلى العديد من السلطات الجيدة والسلطة الجيدة تكون 
جيدة بسبب الإشارة إليها من قبل العديد من المحاور الجيدة. وهذه العلاقات بين المحاور 
والسلطات تجعل من الممكن تلقائيًا dle ggio ål‏ الجودة من الويب. 

إن أكثر الخوارزميات المعروفة والمشار إليها بشكل عام وا مستخدمة في حساب المحاور 
والسلطات هي البحث عن الموضوع الذي يُحدثه الارتباط التشعبي (1115]) والذي تم تطويره 
في الأصل من قبل (1999 ,عإ٠ط”1ء1).‏ ومنذ ذلك الحين تم تحسينه أكثر من مرة بواسطة 
العديد من الباحثين. إن 1115 عبارة عن خوارزمية تحليل رابط تقوم بتصنيف صفحات الويب 
باستخدام معلومات الرابط التشعبي الموجودة بداخلها. وفي سياق بحث الويب» تقوم خوارزمية 
5 بجمع مجموعة وثائق أساسية لاستعلام محدد di, us‏ ثم تقوم بشكل متكرر بحساب 
كل من المحور والسلطة لكل وثيقة. ولتجميع مجموعة الوثائق الأساسية» يتم استدعاء مجموعة 
الجذر التي تطابق الاستعلام من محرك بحث. ولكل وثيقة تم استرجاعهاء تتم إضافة مجموعة 
من الوثائق التي تشير إلى الوثيقة الأصلية ومجموعة أخرى من الوثائق التي يشار اليها بواسطة 
الوثيقة الأصلية إلى المجموعة على أنها منطقة الوثيقة الأصلية. وهكذا تستمر عملية متكررة 
لتحديد هوية الوثيقة وتحليل الرابط حتى تتقارب قيم كل من المحور والسلطة. ثم يتم استخدام 
هذه القيم لفهرسة مجموعة الوثائق التي تم إنشاؤها لاستعلام محدد وترتيبها حسب الأولوية. 

يعتبر التنقيب في هيكل الويب عملية استخراج معلومات مفيدة من الروابط المضمّنة في 
وثائق الويب» ويتم استخدامه لتحديد الصفحات الموثوقة والمحاورء والتي تعتبر حجر الزاوية 
في الخوارزميات المعاصرة للصفحات الأساسية: والتي تعتبر محورية لمحركات البحث الشهيرة 
Google J 5a‏ و200هلا. ومثلما تشير الروابط ال موضوعة لصفحة ويب إلى شعبية الموقع (أو 
موثوقيته)» قد تشير الروابط الموجودة في صفحة الويب (أو موقع الويب الكامل) إلى عمق 
التغطية لموضوع محدد. يعتبر تحليل الروابط مهما للغاية في فهم العلاقات المتبادلة بين أعداد 
كبيرة من صفحات الويب» مما يؤدي إلى فهم أفضل ملجتمع ويب معين. 


أسئلة للمراجعة على قسم :۷-٥‏ 
1- ما هي بعض التحديات الرئيسة التي يفرضها الويب على اكتشاف المعرفة؟ 
۷- ما هو التنقيب في الوبب؟ وكيف يختلف عن التنقيب المنتظم في البيانات أو التنقيب في النصوص؟ 
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8- ما هي المجالات الرئيسة الثلاثة للتنقيب في شبكة الإنترنت؟ 
-٩‏ ما هو التنقيب في محتوى الويب؟ وكيف كن استخدامه لميزة تنافسية؟ 
-٠١‏ ما هو التنقيب في هيكل (بنية) الويب؟ وكيف يختلف عن التنقيب في محتوى الويب؟ 


86-0 محركات البحث: 

في الوقت الحاليء لا يستطيع أحد إنكار أهمية محركات البحث على الإنترنت. وتجدر الإشارة 
إلى أنه كلما زاد حجم وتعقيد شبكة الويب العاطية, أصبح العثور على ما تريد عملية معقدة 
وشاقة. ومن المعلوم أن محركات البحث تُستخدم لأسباب متنوعة. فيمكن استخدامها للتعرّف 
على منتج أو خدمة ما قبل اتخاذ القرار بالشراء (ها في ذلك اختيار البائع أو مقدم الخدمة 
والأسعار على المواقع / الباعة المتنوعة» والقضايا الشائعة التي يناقشها الناس حول هذا المنتج» 
ومدى رضا المشترين السابقينء وما هي المنتجات أو الخدمات الأخرى التي قد تكون أفضلء وما 
إلى ذلك). وللبحث عن الأماكن التي يجب زيارتهاء والأشخاص الواجب الالتقاء بهم والأشياء 
الواجب القيام بها. بمعنى آخرء أصبحت محركات البحث محور معظم ال معاملات المستندة إلى 
الإنترنت وغيرها من الأنشطة. ويستند هذا الادعاء إلى النجاح المذهل والشعبية الجارفة لشركة 
+اع0. وهي الشركة الأكثر انتشارًا في مجال محركات البحث. وما هو غامض إلى حد ما بالنسبة 
للكثيرين هو كيف يقوم محرك البحث بتنفيذ ما يقصده ال مستخدم. بعبارة أبسط يعتبر محرك 
البحث برنامجًا يقوم بالبحث عن الوثائق (مواقع الإنترنت أو الملفات)» استنادًا على الكلمات 
المفتاحية التي يقدمها المستخدمونء والتي تتعلق بموضوع بحثهم (سواء كانت كلمات فردية 
أو مصطلحات متعددة الكلمات أو جملة كاملة). إن محركات البحث اليوم هي منبر الإنترنت» 
وبإمكانها الاستجابة لملايين من الاستفسارات بمئات اللغات المختلفة كل يوم. 

من الناحية التقنيةء فإن ”محرك البحث“ هو المصطلح الشائع لأنظمة استرداد المعلومات. 
وعلى الرغم من أن محركات البحث على الويب هي الأكثر شيوعًاء فغالبًا ما تُستخدم في سياقات 
أخرى غير الويب» مثل محركات بحث سطح المكتب ومحركات بحث الوثائق. وكما سترى في هذا 
القسم. فإن العديد من المفاهيم والتقنيات التي قمنا بتغطيتها في تحليلات النصوص والتنقيب 
في النص في وقت مبكر من هذا الفصل تنطبق هنا أيضًا. ويعتبر المدف العام لمحرك البحث 
هو إرجاع وثيقة / صفحة واحدة أو أكثر والتي تتطابق بشكل أفضل مع طلب بحث ا مستخدم 
وفي حالة وجود أكثر من وثيقة / صفحة واحدة, فغالبًا ما يتم عرضهم في قائمة مُرتّبة وفقًا معيار 
محدد. وغالبًا ما يتم استخدام مقياسين لتقييم محركات البحث. وهما: 
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-١‏ الفعالية (أو الجودة): وتعني العثور على الوثائق / الصفحات الصحيحة. 
؟- الكفاءة (أو السرعة): وتعني إعادة الاستجابة بسرعة. 

ويعمل هذان المقياسان في اتجاهين متعاكسين, بمعنى أن تحسين أحدهما يأتي على حساب 
الآخرء ويكون ذلك بالطبع وفقًا لتوقعات المستخدم. وأفضل محركات البحث هي تلك التي تتفوق 
في كل من المقياسين في نفس الوقت. ونظرًا لأن محركات البحث لا تبحث فقطء بل هي في الواقع 
تجد الوثائق / الصفحات وتعرضهاء فربما كان هناك اسم أكثر ملاءمة لها وهو محركات الإيجاد. 


تشريح محرك بحث: 

الآن دعونا نحلل محرك بحث وننظر في داخله. على أعلى مستوىء يتألف نظام محرك البحث 
من دورتين رئيستين: دورة تطوير ودورة استجابة (ويعرض الشكل )١7-0(‏ هيكل محرك بحث 
نموذجي على الإنترنت). ويمكننا تشبيه دورة التطوير بعملية الإنتاج (تصنيع وتخزين الوثائق / 
الصفحات) ودورة الاستجابة بعملية البيع بالتجزئة (تزويد العملاء / المستخدمين بما يريدون). 
وسيتم شرح هاتين الدورتين بمزيد من التفصيل في القسم التالي من هذا الفصل. 
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شكل :1١-١‏ هيكل نموذجي محرك بحث الإنترنت 








-١‏ دورة التطوير: 

يعتبر المكونان الرئيسان لدورة التطوير هما crawler v4 59Jl cào15‏ ا٥۷‏ ومفهرس الوثيقة 
document indexer‏ ويعد الغرض من هذه الدورة هو إنشاء قاعدة بيانات ضخمة من الوثائق 
/ الصفحات منظمة ومفهرسة بناءً على قيمة محتواها ومعلوماتها. ومما يظهر بوضوح شديد أن 
السبب في تطوير مثل هذا المستودع من الوثائق / الصفحات هو حجمه الكبير وتعقيده» فالبحث 
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التحليلات التنبؤية (؟): تحليلات النص والويب ووسائل التواصل الاجتماعي 


في الويب للعثور على صفحات استجابة لتلبية احتياجات المستخدمين ليس عمليًا (أو ممكنًا في إطار 
زمني معقول) ولذلك تقوم محركات البحث ”بتخزين الويب“ في قاعدة البيانات الخاصة بهاء ومن 
ثم تستخدم النسخة المخبأة للويب للبحث عن وإيجاد كل ما يطلبه المستخدم. وبمجرد إنشائهاء 
تسمح قاعدة البيانات هذه بلحركات البحث بالرد بسرعة وبدقة على استعلامات المستخدمين. 


- زاحف الويب 210198 185: (ويس مى أيضًا العنكبوت أو عنكبوت الويب) وهو جزء من برنامج 
يقوم بالتصفح بشكل منهجي (أي يزحف عبر الإنترنت) بغرض العثور على صفحات الويب وجلبها. 
وفي كثير من الأحيان تقوم برامج زحف الويب بنسخ كل الصفحات التي تتم زيارتها وذلك لعالجتها 
لاحقًا بواسطة وظائف أخرى لحرك البحث. يبدأ زاحف الويب بإعداد قائمة من عناوين .1711 
المراد زيارتهاء ويتم سردها في جدولء وغالبًا ما يطلق عليها البذور. وقد تأت عناوين 1011 هذه 
من تقدهات مشرفي المواقع أو - في أغلب الأحيان - تأي من الروابط التشعبية الداخلية للوثائق / 
للصفحات التي تم الزحف إليها سابقًا. ومجرد أن يزور الزاحف ola URL oss‏ فإنه يحدد 
جميع الروابط التشعبية الموجودة في الصفحة ويضيفها إلى قائمة عناوين .1111 المراد زيارتها. وتتم 
زيارة عناوين :1011 المجدولة بشكل متكرر وفقًا لمجموعة من السياسات التي يحددها محرك 
البحث المحدد. ونظرًا لوجود عدد كبير جدًا من صفحات الويبء فيمكن للزاحف تنزيل عدد 
محدود فقط منها في وقت معين فقط؛ ولذلك فهي تحتاج إلى تحديد أولويات التنزيلات الخاصة بها. 
- مفهرس الوثيقة 120665 006111261: عندما يتم العثور على الوثائق وجلبها من خلال 
الزاحف» يتم تخزينها في منطقة مؤقتة لمفهرس الوثيقة وذلك لاستخراجها ومعالجتها. ويكون 
مفهرس الوثيقة مسؤولا عن معالجة الوثائق (صفحات الويب أو ملفات الوثائق) ووضعها 
في قاعدة بيانات خاصة بها. ولتحويل الوثائق / الصفحات إلى التنسيق المرغوب فيه والقابل 
للبحث عنه بسهولة» يقوم مفهرس الوثائق بتنفيذ المهام التالية: 
- الخطوة -١‏ المعالجة المسبقة للوثائق: نظرًا لاحتمالية ظهور الوثائق المتحصل عليها عن طريق 
الزاحف في تنسيقات مختلفة. ولسهولة معالجتها أكثر. فسيتم في هذه الخطوة تحويلها كلها 
إلى أحد أنواع التمثيل القياسي. فمثلًا يتم فصل المحتويات المختلفة عن بعضها البعض 
ومن ثم تنسيقها (إذا لزم الأمر)ء وتخزينها في مكان ما لزيد من اللعالجة. وتتضمن هذه 
المحتويات ملا (النصوص,» الروابط التشعبيةء الصور, إلخ). 
- الخطوة ۲- تحليل الوثائق: وهذه الخطوة هي أساسّا تطبيق أدوات وتقنيات التنقيب في 
النص (أي اللغويات الحاسوبيةء ومعالجة اللغة الطبيعية )١1۶‏ إلى مجموعة من الوثائق 
/ الصفحات. وفي هذه الخطوة يتم أولا تحلي ل الوثائق القياسية إلى مكونات لتحديد 
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الكلمات / المصطلحات الجديرة بالفهرسة»ء ثم بعد ذلك - وباستخدام مجموعة من القوانين 
- تتم فهرسة الكلمات / المصطلحات. وبشكل أكثر تحديدًا - وباستخدام قواعد التحويل - 
يتم استخراج الكلمات / المصطلحات / الكيانات من الجمل الموجودة في هذه الوثائق» ثم 
باستخدام معاجم خاصة: يتم تصحيح الأخطاء الإملائية والأخطاء الأخرى في هذه الكلمات 
/ المصطلحات» مع ملاحظة عدم كون كل المصطلحات من أدوات التمييز. كما يتم استبعاد 
الكلمات / المصطلحات غير التمييزية (والمعروفة أيضًا باسم كلمات التوقف) من القائمة 
الجديرة بالفهرسة. ونظرًا لاحتمال ظهور نفس الكلمة / المصطلح بصيغ متعددة ومختلفة, 
فيتم اتخاذ بعض الإجراءات التي تعمل على تقليل عدد الكلمات / المصطلحات ووضعها في 
صورها الأصلية. ومرةً أخرى» يتم استخدام المعاجم وموارد أخرى خاصة بلغة معينة Jia)‏ 
gaas ois kS (WordNet‏ المرادفات والمجانسات اللفظية؛ لمعالجة مجموعة الكلمات / 
المصطلحات قبل الانتقال إلى مرحلة الفهرسة. 

- الخطوة "- إنشاء مصفوفة "المصطلح بحسب الوثيقة“ غامعدسبهم0-ز-صمع]: 

في هذه الخطوة: يتم تحديد العلاقات بين الكلمات / المصطلحات والوثائق / الصفحات. 
ويمكن أن يكون الوزن بسيطًا كتخصيص )١(‏ للحضور أو (0) للغياب في الوثيقة / الصفحة. 
وعادةً ما يتم استخدام مخططات الوزن الأكثر تطورًا. وعلى سبيل المثال في تعارض ثنائي» قد 
يتم تخصيص التكرار كوزن (أي عدد مرات وجود نفس الكلمة / المصطلح في الوثيقة). وكما 
رأينا سابقًا في هذا الفصلء فقد أشارت الأبحاث والممارسات المتعلقة بالتنقيب عن النصوص 
بوضوح أن أفضل ترجيح قد a db‏ استخدام مصطلح التكرار مقسومًا على تكرار العكسي 
الوثيقة 121 / 1۴). تقيس هذه الخوارزمية تكرار حدوث كل كلمة / مصطلح في وثيقة ما 
ثم تقارن ذلك التكرار في مقابل تكرار حدوثه في مجموعة الوثائق. وكما نعلم جميعًاء لا تعتبر 
كل الكلمات / المصطلحات ذات التكرار العالي عوامل تمييز جيدة للوثيقة: وأيضًا فإن أحد 
العناصر الجيدة لتمييز الوثيقة في مجال ما قد لا يكون جيدًا في مجال آخر. وبمجرد تحديد 
مخطط الوزن» يتم حساب الأوزان ويتم إنشاء ملف فهرس «المصطلح بحسب الوثيقة». 

-٣‏ دورة الاستجابة: 
يعتبر المكونان الرئيسان لدورة الإ تجابة هما محلل الاستعلام ,اة رعو ومُطابق / 

-document matcher/ranker مصنف الوثيقة‎ 

- محلل الاستعلام :3021726 :(161ا: يكون محلل الاستعلام مسؤولًا عن تلقي طلب البحث 

من المستخدم (عبر واجهة خادم الويب لملحرك البحث) وتحويله إلى هيكل بيانات قياسي 
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التحليلات التنبؤية (؟): تحليلات النص والويب ووسائل التواصل الاجتماعي 
بحيث ممكن استجوابه / مطابقته بسهولة في مقابل الإدخالات في قاعدة بيانات الوثيقة. إن 
كيفية قيام محلل الاستعلام بما يفترض عمله تشابه تمامًا ما يقوم به مفهرس الوثيقة (كما تم 
توضيحه منذ قليل)؛ حيث يقوم محلل الاستعلام بتوزيع جملة البحث إلى كلمات / مصطلحات 
فردية باستخدام سلسلة من المهام التي تشمل التحويلء وإزالة كلمات التوقف» وتطبيق بعض 
الإجراءات: وتوضيح الكلمة / المصطلح (أي تحديد الأخطاء الإملائية» والمترادفات والمجانسات 
اللفظية). إن التشابه الوثيق بين محلل الاستعلام ومفهرس الوثيقة ليس من قبيل الصدفة. في 
الواقع» إن هذا التشابه منطقي تمامًا نظرًا ON‏ كليهما يعمل خارج قاعدة بيانات الوثائق؛ فأحدها 
يضع الوثائق / الصفحات باستخدام هيكل فهرس محدد. والآخر يقوم بتحويل سلسلة استعلام 
إلى نفس الهيكل بحيث يمكن استخدامها لتحديد موقع الوثائق / الصفحات ذات الصلة بسرعة. 
:document matcher/ranker 4à33Jl iuas / glah -‏ وهنا تتم مطابقة بيانات الاستعلام 
المهيكلة مع قاعدة بيانات الوثيقة للعثور على الوثائق / الصفحات الأكثر ملاءمة وترتيبها أيضًا 
حسب ترتيب وثاقة الصلة بالموضوع / الأهمية. وربما يكون إتقان هذه الخطوة هو المكون 
الأكثر أهمية عند مقارنة محركات البحث المختلفة مع بعضها البعض. JS digg‏ محرك بحث 
خوارزمية خاصة به (وغالبًا تكون ملكية مرخصة) يستخدمها لتنفيذ هذه الخطوة المهمة. 
استخدمت محركات البحث في بداية ظهورها تطابقًا بسيطًا للكلمة المفتاحية مع قاعدة 
بيانات الوثائق وأعادت قائمة الوثائق / الصفحات المرتبة» حيث كان يعتبر تحديد الطلب هو 
إحدى الوظائف التي استخدمت عدد الكلمات / المصطلحات المتطابقة بين الاستعلام والوثيقة إلى 
جانب أوزان تلك الكلمات / المصطلحات. لم تكن جودة وفائدة نتائج البحث كلها جيدة. بعد 
ذلك وتحديدًا في عام /1991: توصل منشئو 600816 إلى خوارزمية جديدة تسمى -Page Rank‏ 
وكما يشير الاسم. يعتبر 1316 +238 طريقة حسابية لترتيب الوثائق / الصفحات بناءً على مدى 
ملاءمتها وقيمتها / أهميتها. وعلى الرغم من كون 121 ©7886 طريقة مبتكرة لتصنيف الوثائق 
/ الصفحات» إلا أنه يعد زيادةً في عملية استرجاع الوثائق ذات الصلة من قاعدة البيانات وترتيبها 
La‏ على أوزان الكلمات / المصطلحات. تقوم عاع600 بكل ذلك بشكل جماعي بغرض إعداد 
أفضل قانئمة وثائق / صفحات من حيث الصلة بطلب البحث المعطّى. وبمجرد إنشاء قائمة مرتبة 
من الوثائق / الصفحات» يتم إعادتها مرةً أخرى إلى المستخدم بتنسيق سهل الاستيعاب. في هذه 
المرحلة, قد يختار المستخدم أي وثيقة من الوثائق الموجودة في القائمة والنقر عليهاء وقد لا تكون 
هذه الوثيقة هي الأولى في أعلى القائمة. وإذا حدث هذا وتم اختيار وثيقة / صفحة غير الموجود 
في أعلى القائمة, فهل يمكننا أن نفترض أن محرك البحث م يقم بترتيبهم ترتيبًا جيدًا؟ قد تكون 
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الإجابة نعم حيث تقوم محركات البحث الرائدة مثل 6اع00© مراقبة أداء نتائج البحث الخاصة 
بها من خلال التقاط وتسجيل وتحليل إجراءات وتجارب ما بعد تسليم المستخدمين. وغالبًا 
ما تؤدي هذه التحليلات إلى المزيد والمزيد من القواعد بهدف زيادة تحسين ترتيب الوثائق / 
الصفحات بحيث تكون الروابط في الأعلى هي الأكثر تفضيلًا للمستخدمين النهائيين. 


تحسين محرك البحث: 

إن تحسين محرك البحث (580) هي ممارسة يقصد منها التأثير على رؤية موقع التجارة 
الإلكترونية أو موقع الويب في نتائج البحث الطبيعية (غير المدفوعة أو الأساسية) بلحرك البحث. 
ele JS zog‏ كلما ارتفعت الرتبة في صفحة نتائج البحثء وكلما تكرر ظهور الموقع في قائمة 
نتائج البحثء ازداد عدد الزوار الذين سيحصلون عليه من مستخدمي محرك البحث. وكإحدى 
إستراتيجيات التسويق عبر الإنترنت» تضع 580 في اعتبارها كيفية عمل محركات las «ani‏ 
يبحث عنه الأشخاص.ء والمصطلحات الحقيقية للبحث أو الكلمات المفتاحية التي تتم كتابتها في 
محركات البحثء ومحركات البحث التي يفضلها الجمهور المستهدف. وقد ينطوي تحسين موقع 
الويب على تعديل محتواه و.1112341 والتشفير المرتبط به لزيادة مدى ملاءمته لكلمات رئيسة 
محددة ولإزالة الحواجز أمام أنشطة الفهرسة لمحركات البحث. كما يعد الترويج لموقع ما بغرض 
زيادة عدد الروابط الخلفية أو الداخليةء أحد الأساليب الأخرى لتحسين محركات البحث. 

في السابق» ولكي تتم الفهرسة» كان على كل مشرفي اللواقع إرسال عنوان صفحة» أو عنوان 
JI URL‏ مختلف المحرکات والتي ستقوم بعد ذلك بإرسال ”عنكبوت”“ لي يقوم ب ”الزحف“ 
تجاه تلك الصفحةء ومن ثم يستخرج منها الروابط إلى صفحات» ثم يقوم بإرجاع امعلومات التي 
تم العثور عليها على الصفحة إلى الخادم لتتم الفهرسة. وكما تم التوضيح من قبلء تتضمن هذه 
العملية قيام عنكبوت محرك بحث بتنزيل صفحة وتخزينها على الخادم الخاص محرك البحثء 
حيث يقوم برنامج آخر - يعرف باسم المفهرس - باستخلاص معلومات متنوعة عن تلك الصفحة, 
مثل الكلمات التي تحتويها ومواقع تلك الكلمات بالتحديدء بالإضافة إلى أي وزن لكلمات محددة, 
وكل الروابط التي تحتوي عليها الصفحة: والتي تتم جدولتها بعد ذلك بغرض القيام بالزحف في 
وقت لاحق. أما الآن» فلم تعد محركات البحث تعتمد على تقديم مشرفي المواقع عناوين .1011 
(على الرغم من قدرتهم على فعل ذلك حتى الآن)؛ ولكنهم يمارسون الزحف الحثيث والمستمر 
على الويب لإيجاد وجلب وفهرسة كل شيء يتعلق بالبحث. 

إن إجراء الفهرسة بواسطة Yahoos Bing Google |J is C. ou Cl,‏ ليس حِيدًا بما 
فيه الكفاية للأنشطة التجارية. حيث إن اكتساب ترتيب على محركات البحث الأكثر استخدامًا 


£v‏ ذكاء الأعمال والتحليلات وعلم البيانات. منظور إداري 


التحليلات التنبؤية (؟): تحليلات النص والويب ووسائل التواصل الاجتماعي 


والحصول على مرتبة أعلى من منافس يك هو ما يصنع الفرق (انظر الفكرة التطبيقية (F-0)‏ 
للحصول على قائمة محركات البحث الأكثر استخدامًا). ويمكن رفع ترتيب صفحة ويب داخل 
نتائج البحث باستخدام مجموعة متنوعة من الأساليب. كما أن الارتباط المتبادل بين صفحات 
نفس موقع الويب يوفر مزيدًا من الروابط إلى الصفحات الأكثر أهمية مما يزيد من فرص رؤيتها 
ضمن نتائج البحث. وستؤدي كتابة المحتوى الذي يتضمن عبارات الكلمات المفتاحية التي يتم 
البحث عنها بشكل متكرر - بحيث تكون ذات صلة بمجموعة كبيرة من استعلامات البحث - إلى 
زيادة عدد الزيارات. كما أن تحديث المحتوى بغرض الحفاظ على الزحف إلى محركات البحث 
بشكل متكرر يضفي على الموقع زيادة في الوزن. وكذلك تؤدي إضافة كلمات رئيسة ذات صلة إلى 
البيانات الوصفية لصفحة الويب - بما في ذلك علامة العنوان والوصف الدقيق - إلى تحسين مدى 
ملاءمة قوائم البحث الخاصة بالموقع: وبالتائي زيادة عدد الزيارات. ويمكن أن تساعد تسوية 
عناوين 10181 لصفحات الويب - بحيث يمكن الوصول إليها عبر عناوين 0۸1 متعددة واستخدام 
عناصر ربط العناوين الأساسية والاتجاهات - في التأكد من أن جميع الروابط المؤدية إلى إصدارات 
مختلفة من عنوان .1015 يتم احتسابها في جميع أنحاء نقاط انتشار رابط الصفحة. 
رؤية فنية :۴-٥‏ 
أعلى ١0‏ محرك بحث الأكثر انتشارًا (أغسطس )7١15‏ 
نعرض فی ما ياي أعلى ١5‏ محرقًا من محركات البحث الأكثر انتشارًا ومصدرها 

«zmba.com/articles/search-ngines JU. SM! «53 ebizMBA Rank) :5« 

وهو متوسط یتم تحدیثه باستمرار ġo JI‏ مقع «Alexa Global Traffic Rank‏ و 

-Quantcasts Compete من‎ |J$ 32 U.S.Traffic Rank 
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طرق تحسين محركات البحث: 

بشكا عام يمكن تصنيف تقنيات تحسين محركات البحث إلى فئتين رئيستين: 
-١‏ التقنيات التي توصي بها محركات البحث كجزء من التصميم الجيد للموقع. 
۲- التقنيات التي لا تقبلها محركات البحث. 

تحاول محركات البحث تقليل تأثير النوع الثاني - والذي غالبًا ما يسمى عصل<20:م5 
(ويُعرف أيضًا باسم البحث غير المرغوب فيه <تهم5 562 أو محرك بحث غير مرغوب فيه 
«search engine spam‏ أو تسمم محرك البحث (search engine poisoning‏ وقد تم تصنيف 
هذه الأساليب والممارسين لها إلى قسمين: أدوات 580 ذات قبعة بيضاء وأدوات 510 ذات قبعة 
(Goodman, 2005) slag—w‏ حيث تميل القبعات البيضاء إلى إفراز نتائج تدوم لفترة طويلة: في 
حين تتوقع القبعات السوداء حظر مواقعها في نهاية المطاف إما بشكل مؤقت أو دائم بمجرد أن 
تكتشف محركات البحث ما تفعله. 


تعتبر تقنية تحسين محركات البحث (580) قبعة بيضاء إذا كانت متوافقة مع إرشادات محرك 
البحث ولا تحتوي على أي خداع. ونظرًا لأن إرشادات محرك البحث لا تكتب كسلسلة من القواعد 
أو الوصاياء فإن هذا تمييز مهم يجب ملاحظته. ولا يقتصر دور 580 ذات القبعة البيضاء على اتباع 


الإرشادات فحسب» بل هتد إلى ضمان أن المحتوى الذي يفهرسه محرك البحث ثم يصنف لاحقًا هو 
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نفس المحتوى الذي سيراه أي مستخدم. وعادةً ما يتم تلخيص نصيحة القبعة البيضاء على أنها إنشاء 
محتوى للمستخدمينء وليس لمحركات البحث. ثم تسهيل الوصول لهذا المحتوى بواسطة العناكب» 
بدلا من محاولة خداع الخوارزمية من الغرض اراد منها. كما يعتبر 58:0 ذو القبعة البيضاء أحد 
الأوجه العديدة المشابهة لتطوير الويب الذي يدعم إمكانية الوصولء على الرغم من تطابقهما. 

يحاول 580 ذو القبعة السوداء تحسين الترتيب بطرق غير مقبولة من جانب محركات 
al‏ أو بأساليب تنطوي على شيء من الخداع. تستخدم تقنية القبعة السوداء النص المخفيء 
إما بتلوينه بنفس لون الخلفية أو بعلامة ”01“ غير مرئية أو بوضعه خارج الشاشة. وتعطي 
طريقة أخرى صفحة مختلفة اعتمادًا على كون الصفحة مطلوبة سواء بواسطة زائر بشري أو 
محرك بحثء وهي تقنية تُعرف باسم إخفاء الهوية أو التغطية LS „cloaking‏ قد تعمد محركات 
البحث إلى معاقبة المواقع التي تكتشفها باستخدام أساليب القبعة السوداء. إما عن طريق تقليل 
ترتيبها أو إزالة قوائمها من قواعد بياناتها تمامًا. ويمكن توقيع هذه العقوبات إما تلقائيًا من خلال 
خوارزميات محركات البحث أو من خلال مراجعة يدوية للموقع. ومن الأمثلة على ذلكء ما 
قامت به شركة #اع6008 في فبراير ٠٠١“‏ عندما قامت بإزالة كل من 834517 أمانيا وطمه181 أمانيا 
لقيامهما بمممارسات غير معتمدة (2006 ,5ا]نا©). ومع ذلك» سارعت الشركتان بتقديم الاعتذار 
وتصحيح ممارساتهماء ومن ثم تمت إعادتهما إلى 4&8 -Google‏ 

بالنسبة لبعض الأنشطة التجارية قد يحقق 580 عائدًا كبيرًا على الاستثمار. ومع ذلك. يجب 
الأخذ في الاعتبار أن محركات البحث غير مدفوعة لحركة البحث المجانيء وأن خوارزمياتها تتغير 
باستمرارء ولا توجد ضمانات لاستمرار الإحالات. وبسبب هذه الحالة من عدم اليقين أو عدم 
الاستقرارء فقد تتكبد الأعمال التجارية التي تعتمد بشكل كبير على زيارات محركات البحث خسائر 
كبيرة إذا قرر محرك البحث تغيير خوارزمياته والتوقف عن استقبال الزوار. يقول غ4نتصك5 Eric‏ 
الرئيس التنفيذي لشركة عاع600: ”أجرت à Google‏ عام ٠‏ أكثر من 00١‏ تغيير خوارزمية, 
أي ما يقرب من ١,0‏ تغيير في اليوم الواحد“. ونظرًا لصعوبة مواكبة قواعد محرك البحث المتغيرة 
obazab‏ فإن الشركات التي تعتمد على حركة البحث تمارس واحدًا أو أكثر من الإجراءات التالية: 
-١‏ استئجار شركة متخصصة في تحسين محركات البحث (والتي يتوافر عدد كبير منها في هذه الأيام) 

وذلك لتحسين جاذبية الموقع الخاص بها باستمرار لتغيير ممارسات محركات البحث. 
۲- تشجيع شركات محركات البحث لإدارج أسمائهم في أقسام الجهات الراعية المدفوعة. 
*- النظر في التحرر من الاعتماد على حركة محرك البحث. 
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إن أهم ما هيز أي مواقع تجارة إلكترونية - سواء كانت معتمدة على محركات البحث 
(بعضوية أو بدون) أو قادمة من مواقع وأماكن أخرى - هو زيادة احتمالية معاملات العملاء إلى 
أقصى حد. ولا يعتبر وجود عدد كبير من الزائرين دون مبيعات هو ما تم تصميمه بلوقع التجارة 
الإلكترونية النموذجي. وتتعلق الحالة العملية )۷-٥(‏ مركز تسوق كبير يعتمد على الإنترنت حيث 
يتم استخدام تحليل مفصل لسلوك العميل (باستخدام نقرات ومصادر البيانات الأخرى) لتحسين 


معدل التحويل بشكل ملحوظ. 


حالة عملية ۷-٥‏ 
فَهْم لماذا يؤدي التنازل عن عربات التسوق إلى زيادة مبيعات بمقدار ٠١‏ مليون دولار 

قام مركز <زمء.»]1:01 وهو مركز تسوق الإنترنت الرائد في كوريا والذي يضم 
١‏ مليون عميلء بتطوير نظام متكامل لتحليل حركة زيارات الويب باستخدام SAS‏ 
لتحليلات تجربة العملاء. ونتيجة لذلكء تمكن 10٤6.٨٥٥١‏ من تحسين تجربة الإنترنت 
لعملائهاء فضلًا عن تحقيق عوائد أفضل من حملاتها التسويقية. والآنء يمكن للمديرين 
التنفيذيين ل 1.٠۲۲.٠٥‏ تأكيد النتائج في أي مكان وفي أي وقت. بالإضافة إلى إجراء 
تغييرات فورية. 

ومع ما يقرب من مليون زائر ملوقع الويب كل يوم كان 1.0۲١.٠٥١‏ بحاجة إلى معرفة 
عدد الزوار الذين يقومون بالشراء وما هي القنوات التي تجلب الزيارات الأكثر قيمة. بعد 
استعراض العديد من الحلول والأماليب المتنوعة, قدم Gli; Lotte.com‏ متكاملًا خاضًا 
به لتحليل حركة زيارات الويب باستخدام حل 545 لتحليل تجارب العملاء. وهذا هو أول 
نظام للتحليل السلوي على الإنترنت يطبق في كوريا. 

وباستخدام هذا النظام, مکن ممرکز 1.0۵.٥٥٥‏ قیاس وتحليل كل من أعداد زوار 
موقع الويب بدقة؛ والحالة الراهنة لعرض الصفحة أمام slaj‏ الموقع ومبرمي الصفقات. 
وشعبية كل فئة من فئات المنتجات وكذلك شعبية المنتجات نفسهاء والنقرات على 
التفضيلات الخاصة بكل صفحة. وفعالية الحملات. وغير ذلك الكثير. أي أن هذه 
المعلومات تمكّن «:م».1.0]:6 من فهم العملاء وسلوكهم على الإنترنت بشكل أفضل, 
وإجراء التسويق المستهدف المتطور والفعال من حيث التكلفة. 

وتعليقًا Jung Hyo-hoon Jl elbil lis de‏ مساعد المدير العام بفريق 
تخطيط التسويق لوقع 3«م».1.0]16: ”نتيجةً لإدخال نظام تحليل 545: تم اكتشاف 
العديد من”الحقائق الجديدة“حول سلوك العملاء وبعضها كانت «حقائق غير مريحة» 
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وأضاف: ”في الواقع كان لبعض أنشطة تخطيط الموقع التي تم الاضطلاع بها مع توقع 
نتائج معينة رد فعل ضعيف من جانب العملاء. واحتاج مخطط و الموقع وقثًا طويلًا 
للتعرف على هذه النتائج“. 

فوائد: 

وقد أدى تقديم حلول 545 لتحليل تجربة العملاء إلى تحويل موقع الويب .1.0016 
2ه بشكل كامل. ونتيجة لذلكء 106.٠0۳١ (3 S.‏ من تحسين تجربة الإنترنت 
لعملائه بالإضافة إلى تحقيق عوائد أفضل من حملاته التسويقية. ومنذ تطبيق SAS‏ 
لتحليلات تجربة العملاء جنى 1.0.٥۳١‏ العديد من الفوائدء منها: 

قفزة في ولاء العملاء: 

يمكن جمع كمية كبيرة من معلومات النشاط المتطورة في إطار بيئة الزائرء ما في 
ذلك جودة الزيارات. وقال ع«ن[: ”إنه من خلال تحليل الزيارات الصالحة الفعلية 
والبحث في صفحة أو صفحتين فقطء هكننا تنظيم حملات لرفع مستوى الولاء ومن 
ثم تحديد نطاق معين من التأثير. وبالإضافة لذلك» من الممكن تصنيف وتأكيد معدل 
الطلب لكل قناة ومعرفة أي القنوات تحتوي على أكبر عدد من الزائرين". 

تحليل كفاءة التسويق الأمثل: 

لا يقتصر النظام على مجرد تحليل أرقام الزائرين فقط. بل يستطيع تحليل معدل 
التحويل (عربة التسوقه الشراء الفوري, قائمة الرغبات: إتمام الصفقة) مقارنةٌ بالزوار 
الفعليين لكل نوع من أنواع الحملات (الانتساب أو البريد الإلكترونيء اللافتات» الكلمات 
المفتاحية: وغيرها). لذلك يمكنه أيضًا إجراء تحليل مفصل لفعالية القناة. بالإضافة 
إلى ذلك يمكنه التأكد من كلمات البحث الأكثر استخدامًا من جانب الزوار لكل نوع 
حملة وا موقع والمنتجات المشتراة. كما يمكنه عن طريق دالة "تإهاءعه عهدم عط)“ 
قياس عدد النقرات وعدد الزوار لكل عنصر في أي صفحة لقياس قيمة كل موقع في 
الصفحة. تمكن هذه الإمكانية 10٤٤٠.٠0۳‏ من الاستبدال أو التجديد الفوري للعناصر 
ذات الزيارات القليلة. 

رضا العملاء المحسّن وتجاربهم يؤديان إلى ارتفاع المبيعات: 

«Lp Lotte.com el‏ قاعدة بيانات تحليل س لوك العملاء التي تقيس كل زائر» 
والصفحات التي تتم زيارتهاء وكيف يتنقل الزوار في الموقع» والأنشطة التي يتم تنفيذها 
لتمكين التحليل المتنوع وتحسين كفاءة الموقع. بالإضافة إلى ذلكء تحتفظ قاعدة 
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البيانات بمعلومات عن التوزيعات السكانية للعملاء وحجم عربة التسوق ومعدل 
التحويل وعدد الطلبات وعدد المحاولات. 

وبتحليل مراحل عملية الطلب وتحديد المرحلة التي تعيق معظم العملاء ومن ثم 
تثبيت هذه المراحلء يمكن زيادة معدلات التحويل. في السابق, تم التحليل فقط على 
الطلبات الموضوعة. ومن خلال تحليل نمط حركة الزوار قبل الطلبء وعند النقطة 
التي يحدث فيها الانفصالء يمكن توقع سلوك العملاء كما يمكن القيام بأنشطة تسويق 
متطورة. ومن خلال تحليل نمط الزائرين» يمكن أن تتأثر عمليات الشراء بشكل أكثر 
فاعلية وبالتالي ينعكس طلب العملاء بشكل فوري لضمان الحصول على استجابات 
go‏ وقد حدث تحسن في رضا العملاء لوجود فكرة أقضل لدى Lotte.com‏ عن 
سلوكيات واحتياجات واهتمامات كل عميل. 

وفي تقييمه للنظام, علق 28نا[ قائلًا: ”يمكن تحديد تحسينات في خدمة العملاء 
ومواضيع التسويق المستهدفة من خلال معرفة كيفية تحرك كل مجموعة من العملاء 
على أساس البيانات»مما ساعد على نجاح عدد من الحملات“. 

ومع ذلك. فإن الفائدة الأكثر أهمية من هذا النظام هي اكتساب نظرة ثاقبة عن 
العملاء الأفراد ومجموعات العملاء المختلفة. ومن خلال فهم التوقيت الذي يبرم فيه 
العملاء صفقات الشراء وأسلوبهم في التنتقل عبر صفحة الويبء يمكن الآن تحقيق 
التسويق المستهدف للقنوات وتحسين تجربة العملاء. 

بالإضافة إلى ذلك فقد أدى تنفيذ 545 لتحليلات تجربة العملاء من قبل أكبر موزع 
عبر البحار مركز J] Lotte.com‏ زيادة في مبيعات السنة الأولى بقيمة 8 ملايين يورو 
(أي ما يعادل ٠١‏ ملايين دولار أمريي) من خلال تحديد أسباب هجر عربة التسوق. 

أسئلة للمناقشة: 

-١‏ كيف استخدم 1.016.013 التحليلات لتحسين المبيعات؟ 

Us -Y‏ هي التحديات والحل المقترح والنتائج التي تم الحصول عليها؟ 

*- هل تعتقد أن شركات التجارة الإلكترونية تعتبر في وضع أفضل للاستفادة من 
فوائد التحليلات؟ وماذا؟ وكيف؟ 
Sources: From Heightening customer loyalty and optimizing channels, SAS,‏ 
Customer Success Stories.sas.com/success/lotte.html (accessed March 2013).‏ 


Copyright © 2016 SAS Institute Inc., Cary, NC, USA. Reprinted with permission. 
All rights reserved. 
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أسئلة مراجعة على القسم :۸-٥‏ 

۵- ما هو محرك البحث؟ وطاذا تهتم الشركات اليوم بمحركات البحث؟ 

-١‏ ما هو زاحف odg SWeb crawler cug!‏ يُستخدم؟ وكيف يعمل؟ 

۷ ما هو ”تحسين محرك البحث؟“ ومن الذي يستفيد منه؟ 

8- ما هي الأشياء التي يمكن أن تساعد صفحات الويب على احتلال ترتيب أعلى في نتائج محرك البحث؟ 


4-0 التنقيب في استخدام الويب (تحليلات الويب): 

التنقيب في استخدام الويب (ويسمى أيصًا تحليلات الويب) هو استخراج معلومات مفيدة 
من البيانات التي يتم إنشاؤها من خلال زيارات صفحة الويب والمعاملات. ويمكن أن يساعدنا 
Jalos‏ المعلومات التي يتم جمعها بواسطة خوادم الويب على فهم سلوك المستخدم بشكل أفضل. 
وغالبًا ما يطلق على تحليل هذه البيانات تحليل مسار النقر. وقد تتمكن الشركة من JU xui‏ 
مثيرة للاهتمام من مسار النقرء وذلك من خلال استخدام تقنيات التنقيب في البيانات والنصوص. 
فعلى سيل ام مثال» قد تعلم أن >1١‏ من الزائرين الذين بحثوا عن ”فنادق في مأوى“ قد بحثوا 
في وقت سابق عن ”رحلات جوية إلى مأوى“. هذه المعلومات قد تكون مفيدة في تحديد مكان 
وضع الإعلانات عبر الإنترنت. كما أن تحليل مسار النقر قد يكون مفيدًا أيضًا في معرفة وقت 
وصول الزائرين إلى الموقع. فمثلاء إذا كانت إحدى الشركات تعرف أن “1١‏ من تنزيلات البرامج 
من موقعها على الويب قد حدثت بين الساعة السابعة والحادية عشرة مساءٌ فإنها قد تخطط 
للوصول إلى دعم أفضل للعملاء وسعة تحميلية أعلى للشبكة أثناء تلك الفترة. ويعرض الشكل 
(1-0) عملية استخراج المعرفة من بيانات مسار النقر وكيف يتم استخدام تلك المعرفة لتحسين 
كل من العملية وموقع الويبء والأكثر أهمية هو رفع قيمة العميل. 
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تقنيات تحليلات الويب: 

هناك العديد من الأدوات والتقنيات لتحليلات الويب في السوق. وتزداد شعبية أدوات تحليل 
بيانات الإنترنت» نظرًا لقدرتها على قياس بيانات الإنترنت وجمعها وتحليلها لفهم الاستخدام الأمثل 
للويب وتحسينه. وتبشر تحليلات الويب بإحداث ثورة في كيفية إنجاز الأعمال على الويب» كما 
يمكن استخدامها كأداة للأعمال التجارية الإلكترونية وأبحاث السوق ولتقييم وتحسين فعالية مواقع 
الويب الخاصة بالتجارة الإلكترونية. ويمكن لتطبيقات تحليلات الويب أيضًَا مساعدة الشركات في 
قياس نتائج الحملات الإعلانية المطبوعة أو الإذاعية التقليدية. وبالإضافة إلى ذلك فإنه يمكنها أن 
تساعد في تقدير كيفية تغير حركة المرور إلى موقع ويب بعد إطلاق حملة إعلانية جديدة. كما 
توفر تحليلات الويب معلومات حول عدد الزائرين بموقع الويب وعدد مشاهدات الصفحة, فضلًا 
عن مساعدتها في قياس اتجاهات الحركة والرواج» والتي يمكن استخدامها في أبحاث السوق. 

وهناك فئتان رئيستان لتحليلات الويب وهما: خارج الموقح» وقي الموقع. وتشر تحليلات 
الويب خارج الموقع إلى قياس الويب والتحليلات عنك وعن منتجاتك التي تتم خارج موقع الويب 
الخاص بكء» وهو يشمل قياس نسبة المتابعين المحتملين لوقع الويب (احتمال أو فرصة)» ومشاركة 
الصوت (الرؤية أو الكلام الشفهي). والضجيج (التعليقات أو الآراء) الذي يحدث على الإنترنت. 

وقد كانت تحليلات الويب في الموقع هي الأكثر شيوعًا. فمن الناحية التاريخية أشارت تحليلات 
الويب إلى قياس نسبة زائري الموقع. ومع ذلك فقد تضاءل هذا الأمر في السنوات الأخيرة» ويرجع 
ذلك بشكل أساسي إلى أن الموردين ينتجون أدوات تمتد لتشمل كل الطبقات. وتقيس تحليلات 
الويب في الموقع سلوك الزائرين عندما يكونون على موقع الويب الخاص بك ويشمل ذلك برامج 
التشغيل والتحويلات -مثل درجة ارتباط الصفحات المقصودة المختلفة, بالمشتريات عبر الإنترنت. 
كما تقوم تحليلات الويب الموجودة في اللوقع بقياس أداء موقع الويب الخاص بك في سياق تجاري 
ثم تتم مقارنة البيانات المجمعة على موقع الويب بمؤشرات الأداء الرئيسة للأداء واستخدامها في 
تحسين استجابة الجمهور للوقع الويب أو حملة التسويق. وعلى الرغم Google Analytics ùİ ja‏ 
هي خدمة تحليلات الويب الأكثر استخدامًا على نطاق واسع., إلا أن خدمة 000لا ومايكروسوفت» 
والأدوات الجديدة والأفضل التي تظهر باستمرارء توفر طبقات إضافية من ا معلومات. 

وبالنسبة إلى تحليلات الويب في ال موقع» فهناك طريقتان تقنيتان لجمع البيانات. وتتمثل 
الطريقة الأولى والأكثر تقليدية في تحليل ملف سجل الخادم» حيث يقوم خادم الويب بتسجيل 
طلبات الملفات التي تقدمها المتصفحات. وأما الطريقة الثانية فتتمثل في وضع العلامات على 
الصفحات, på å $ Eais JavaScript pasis pily‏ صفحة الموقع لتقديم طلبات الصور إلى 
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خادم مخصص للتحليلات تابع لجهة خارجية كلما تم عرض صفحة من خلال متصفح الويب (أو 
عند حدوث نقرة ماوس). ولإنتاج تقارير المرور على شبكة الإنترنت. يمكن معالجة كل من جمع 
البيانات فضلًا عن هذين المسارين الرئيسينء كما يمكن أيضًا إضافة مصادر بيانات أخرى لزيادة 
بيانات سلوك موقع الويب. وقد تتضمن هذه المصادر الأخرى البريد الإلكترونيء أو بيانات حملة 
البريد المباشر, أو المبيعاتء أو تاريخ القيادة, أو البيانات التي نشأت عبر وسائل التواصل الاجتماعي. 
مقاييس تحليلات الويب: 
توفر برامج تحليلات الويب الوصول إلى الكثير من البيانات التسويقية القيّمة, والتي يمكن الاستفادة 
منها للحصول على إحصاءات أفضل لتنمية أعمالك وتوثيق عائد الاستثمار (201) بشكل أفضلء وذلك 
باستخدام مجموعة متنوعة من مصادر البيانات. ويمكن استخدام البصيرة والذكاء المكتسبة من 
تحليلات الويب لإدارة الجهود التسويقية للمؤسسة ومختلف منتجاتها أو خدماتها بفعالية. وتوفر 
برامج تحليلات الويب بيانات بشكل 5599( 35 o‏ والتي يمكنها توثيق نجاحات حملاتك التسويقية» أو 
تمكينك من إجراء تعديلات في الوقت المناسب على إستراتيجيات التسويق الحالية. 
وفي حين أن تحليلات الويب توفر نطاقًا واسعًا من المقاييس» فهناك أربع فئات من المقاييس قابلة 
للتطبيق بشكل عام ويمكن أن تؤثر بشكل مباشر على أهداف أعمالك )2013 The Westover Group,‏ 
وتشمل هذه الفئات ما يلي: 
- سهولة استخدام موقع الويب: كيف كانوا يستخدمون الموقع الخاص بي على الويب؟ 
- مصادر الزيارات: من أين أتوا؟ 
- ملامح الزوار: كيف يبدو زوار موقعي؟ 
- إحصائيات التحويل: ماذا يعني كل هذا للأعمال؟ 
قابلية استخدام موقع الويب: 
بداية من موقع الويب الخاص éb‏ دعنا نلقي نظرة على مدى نجاحه مع زوارك. فهذا هو 
المكان الذي يمكنك من خلاله معرفة مدى «سهولة استخدامه» بالفعل أو ما إذا كان المحتوى 
الذي يقدمه مناسبًا أم لا. 
-١‏ استعراضات الصفحة: وهو أبسط القياسات» ويتم تقديم هذا المقياس عادةً على أنه ”متوسط 
عدد مشاهدات الصفحة لكل زائر“. فإذا جاء الأشخاص إلى موقعك على الويب وم يشاهدوا 
العديد من الصفحات» فقد يواجه موقعك الإلكتروني مشكلات في تصميمه أو بنيته. وهناك 
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تفسير آخر لانخفاض عدد مشاهدات الصفحة وهو قطع الرسائل التسويقية التي جلبتها إلى 
الموقع وا محتوى المتاح بالفعل. 

۲- الوقت على الموقع: ويشبه مرات مشاهدة الصفحة» فهو مقياس أساسي لتفاعل الزائر مع 
موقع الويب الخاص بك. وبشكل عامء فكلما زاد إنفاق الشخص على موقع الويب الخاص 
به» كان ذلك أفضل. وقد يعني ذلك أنهم يراجعون المحتوى الخاص بك بعناية. مستخدمين 
المكونات التفاعلية المتوفرة لديك» والبناء للوصول إلى قرار مستنير للشراء أو الاستجابة أو 
اتخاذ الخطوة التالية التي قدمتها. وعلى العكس من ذلكء فإنه يجب أيصًّا فحص الوقت 
الممستغرق في الموقع مقابل عدد الصفحات التي تم عرضها للتأكد من أن الزائر لا يقضي وقته 
في محاولة العثور على محتوى يسهل الوصول إليه. 

*- التنزيلات: يتضمن ذلك ملفات 2105 ومقاطع الفيديو والموارد الأخرى التي توفرها لزائريك. 
ولا بد أن تضع في اعتبارك مدى سهولة الوصول إلى هذه العناصر وكذلك مدى الترويج لها. 
Ass‏ إذا كانت إحصائيات الويب الخاصة بك تكشف أن ZT‏ من الأفراد الذين يشاهدون 
فيديو تجريبي يقومون أيصًا بعملية شراء فحينئذ سترغب في وضع إستراتيجية لزيادة نسبة 
المشاهدة لهذا الفيديو. 

-٤‏ خريطة النقر: يمكن لمعظم برامج التحليلات عرض النسبة المئوية للنقرات التي حصل عليها 
كل عنصر على صفحة الويب الخاصة بك. ويتضمن هذا صورًا قابلة للنقرء وروابط نصية في 
نسختككء وتنزيلات» وبالطبع أيصًا أي تنقل قد يكون لديك على الصفحة. هل يقومون بالنقر 
على العناصر الأكثر أهمية؟ 

0- مسارات النقر: على الرغم من أن تقييم مسارات النقر ينطوي على مزيد من المشاركة إلا 
أنه يمكنه الكشف بسرعة أين يمكن أن تفقد الزوار في عملية محددة. ويستخدم موقع ويب 
المصمم بشكل جيد مزيجًا من بنية الرسومات والمعلومات لتشجيع الزائرين على اتباع المسارات 
”المحددة مسبقًا“ من خلال موقع الويب الخاص بك. وهذه المسارات ليست صلبة ولكنها 
خطوات بديهية تنوافق مع مختلف العمليات التي قمت بإنشائها في موقع الويب. وقد تكون 
إحدى هذه العمليات هي ”تعليم“ الزائر الذي لديه أدنى فهم لمنتجك أو خدمتك. وقد تكون 
الأخرى عملية ”تحفيز للزائر الذي يعيد النظر مرة أخرى في تحديث أو إعادة شراء. LÍ‏ 
العملية الثالثة فقد يتم تنظيمها حول العناصر التي تسوقها عبر الإنترنت. وسوف يكون لديك 
العديد من مسارات العمليات في موقع الويب الخاص بك كما يكون لديك الجماهير المستهدفة 
والمنتجات والخدمات. ويمكن قياس كل منها من خلال تحليلات الويب لتحديد مدى فعاليتها. 
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مصادر الزيارات: 

برنامج تحليلات الويب الخاص بك هو أداة لا تصدق لتحديد مكان الزيارات الخاصة بك على 
الويب. ويتم تصنيف الفئات الأساسية مثل محركات البحث ومواقع الويب المرجعية والزيارات 
من الصفحات التي تم وضع إشارة عليها (مثل: المباشرة) مع القليل من مشاركة المسوق. كما 
يمكنك أيضًا تحديد زيارات الويب التي تم إنشاؤها بواسطة حملاتك الإعلانية المتعددة غير 
المتصلة أو عبر الإنترنت» بقليل من الجهد. 


Els òl Referral éh مواقع الويب التي تقوم بإحالة الزائرين إلى موقع الويب الخاص‎ -١ 
الويب التي تحتوي على روابط تقوم بإرسال الزائرين مباشرةً إلى موقع الويب الخاص بك»‎ 
تعتبر مواقع ويب مرجعية» وسيقوم برنامج التحليلات الخاص بك بتحديد كل موقع يتم‎ 
إرسال الزيارة لك منهء كما يوجد تحليل أعمق سيساعدك على تحديد الإحالات التي تنتج‎ 
الحجم الأكبرء والتحويلات الأعلى» والزوار الأحدث, وما إلى ذلك.‎ 

-١‏ محركات البحث: يتم تقسيم البيانات في فئة محركات البحث بين البحث مدفوع الثمن 
والبحث الأساسي (أو الطبيعي). ويمكنك مراجعة أهم الكلمات المفتاحية التي أنتجت الزيارة 
إلى موقعك ومعرفة ما إذا كانت هذه الكلمات تمثل منتجاتك وخدماتك أم لا. واعتمادًا 
على عملك قد ترغب في الحصول على مئات (أو آلاف) الكلمات المفتاحية التي تحدد ملامح 
العملاء المحتملين. وحتى أبسط بحث عن المنتج يمكن أن يكون بمتغيرات تعتمد على شكل 
العبارات الفردية في طلب البحث. 

*- المباشرة: وتنسب عمليات البحث المباشرة إلى مصدرين. يتمثل الأول في الشخص الذي يضع 
إشارة مرجعية على إحدى صفحات الويب الخاصة بك في صفحاته المفضلة ويضغط على هذا 
الرابط فيتم تسجيله كبحث مباشر. أما المصدر الثاني فيتمثل في كتابة شخص ما لعنوان .1011 
الخاص بك مباشرة في متصفحه. ويحدث هذا عندما يسترد شخص ما عنوان :1711 الخاص بك 
من بطاقة أعمال أو كتيب أو إعلان مطبوع أو إعلان راديو وما إلى ذلك: وهذا هو السبب في 
كونها إستراتيجية جيدة لاستخدام عناوين .1181 المشفرة. 

-E‏ حملات ليست عبر الإنترنت: إذا كنت تستخدم خيارات الإعلان إلى جانب الحملات القائمة 
على الويب» فيمكن لبرنامج تحليلات الويب الخاص بك التقاط بيانات الأداء إذا قمت بتضمين 
آلية لإرسالها إلى موقع الويب الخاص بك. وعادةً ما يكون هذا العنوان .1781 المخصص 
الذي قمت بتضمينه في الإعلان الخاص بك (مثل: (Cwww.mycompany.com/offer50"‏ 
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هو العنوان الذي يقدم هؤلاء الزوار لصفحة معينةء ويصبح لديك الآن بيانات حول عدد 
المستجيبين لذلك الإعلان عن طريق زيارة موقع الويب الخاص بك. 

0- حملات عبر الإنترنت: إذا كنت تعتمد على اللافتات الإعلانية» أو إعلانات على محرك بحثيء أو 
حتى حملة بريد إلكترونيء فيمكنك قياس فعالية تلك الحملات الفردية بمجرد استخدام عنوان 
URL‏ مخصص مشابه لإستراتيجية الحملة التي لا تعتمد على الإنترنت. 


الملفات الشخصية للزوار: 
وهي إحدى الطرق التي يمكنك من خلالها الاستفادة من تحليلات الويب الخاصة بك وتحويلها 

إلى أداة تسويقية حقيقية وذلك من خلال التقسيم إلى شرائح. ومن خلال مزج البيانات من تقارير 

التحليلات ال مختلفةء ستبدأ في مشاهدة مجموعة متنوعة من الملفات الشخصية للمستخدمين. 

-١‏ الكلمات المفتاحية: فمن خلال تقرير التحليلات الخاص بكء يمكنك معرفة الكلمات المفتاحية 
التي يستخدمها الزوار في محركات البحث لتحديد موقع الويب الخاص بك. فإذا قمت بتجميع 
كلماتك الرئيسة بسمات مشابهة» فإنك ستبدأ في رؤية مجموعات مميزة من الزوار تستخدم 
موقع الويب الخاص بك. فمثلا يمكن أن تشير عبارة البحث المحددة التي تم استخدامها إلى 
مدى فهمهم لمنتجك أو فوائده. وإذا استخدموا الكلمات التي تعكس وصف المنتج أو الخدمة 
الخاصة بكء فهذا يعني أنهم قد يكونون بالفعل على علم بالعروض الخاصة بك من الإعلانات 
الفعالة والكتيبات وما إلى ذلك. وإذا كانت الشروط أكثر عمومية بطبيعتها فإن زائرك يبحث 
عن حل لمشكلة ما وقد حصل على موقع الويب الخاص بك. وإذا كانت هذه المجموعة الثانية 
من الباحثين كبيرة الحجم» فإنك ستحتاج إلى التأكد من أن موقعك يحتوي على مكون تعليمي 
قوي لإقناعهم بأنهم قد وجدوا إجابتهم ومن ثم نقلهم إلى قناة مبيعاتك. 

-١‏ تجمعات المحتوى: فمن خلال الاعتماد على كيفية تجميع المحتوى الخاص بكء قد تتمكن من 
تحليل أقسام موقع الويب الخاص بك والتي تتوافق مع منتجات وخدمات وحملات وأساليب 
تسويقية أخرى. فإذا كنت تدير الكثير من المعارض التجارية وزادت الزيارات إلى موقع 
الويب الخاص بك بحثًّا عن المنشورات الخاصة بمنتج معين» فإن تحليلات الويب الخاصة بك 
سوف تقوم بتسليط الضوء على النشاط في ذلك القسم. 

*- الجغرافيا: حيث تسمح لك التحليلات بمعرفة المكان الذي تنبع منه الزيارات جغرافيًه مما في 
ذلك البلد والولاية والمدينة. وقد يكون هذا مفيدًا بالنسبة لك خاصةً إذا كنت تستخدم حملات 
تستهدف مواقع جغرافية معينة أو كنت تريد قياس مشاهداتك في منطقة ما. 
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ع- فترات اليوم: La baled‏ تصل زيارات الويب إلى ذروتها في بداية يوم العمل وخلال وقت الغداء 
وفي نهاية يوم العمل. ومع ذلكء وليس من المعتاد إيجاد زيارة قوية إلى موقع الويب الخاص 
بك في وقت متأخر من المساء. ويمكنك تحليل هذه البيانات لتحديد مواعيد تصفح الناس في 
مقابل الشراء وأيضًا اتخاذ القرارات بشأن الساعات التي يجب أن تقدم فيها خدمة العملاء. 

ه- خصائص صفحات مطلوبة للبحث: فإذا قمت بتنظيم حملاتك الإعلانية المختلفة بشكل 
صحيح. فإنه يمكنك توجيه كل مجموعة من مجموعاتك المستهدفة إلى صفحة مقصودة 
مختلفةء والتي ستقوم تحليلات الويب الخاصة بك بالتقاطها وقياسها. ومن خلال الجمع بين 
هذه الأرقام والتوزيعات السكانية لوسائل الحملة الخاصة بكء يمكنك معرفة النسبة المئوية 
للزوار التي تناسب كل فئة سكانية. 


إحصائيات التحويل: 
سوف تقوم كل منظمة بتعريف «التحويل» وفقًا للأهداف التسويقية الخاصة بها. وتستخدم 

بعض برامج التحليلات مصطلح هدف (1١٠ع)‏ لقياس أهداف موقع ويب معينء سواء كان ذلك عددًا 

معينًا من الزائرين لصفحة ما أو نموذج تسجيل تام أو عملية شراء عبر الإنترنت. 

-١‏ الزوار الجدد: فإذا كنت تعمل على زيادة مستوى الرؤية» فإنك ستحتاج إلى دراسة المؤشرات 
في بيانات الزائرين الجددء حيث يصنف برنامج التحليلات جميع الزوار على أنهم إما جُدد أو 
مترددين على gi‏ 

؟- رجوع الزوار: فإذا كنت تشارك في برامج الولاء أو تقدم منتجًا يحتوي على دورة شراء طويلة 
فستساعدك بيانات زوارك العائدين في قياس التقدم في هذا المجال. 

-Y‏ القيادات: فبمجرد تقديم نموذج وتوليد صفحة شكرء فإنك بذلك قد تكون جذبت قائد, حيث 
تسمح لك تحليلات الويب بحساب معدل الإكمال (أو معدل التخلي) عن طريق قسمة عدد 
النماذج المكتملة على عدد زائري الويب الذين جاءوا إلى صفحتك. وتشير النسبة المئوية 
للإكمال المنخفض إلى أن الصفحة تحتاج إلى الاهتمام. 

ع- المبيعات / التحويلات: اعتمادًا على هدف موقع الويب الخاص بكء يمكنك تحديد ”البيع“ من 
خلال صفقة عبر الإنترنت» أو تسجيل مكتملء أو تقديم عبر الإنترنت» أو أي عدد من أنشطة الويب 
الأخرى. ومراقبة هذه الأرقام سوف تنبهك إلى أي تغييرات (أو نجاحات!) تحدث في مراحل أعلى. 

5- معدلات المغادرة / الخروج: وهي لا تقل أهمية عن معدلات التحرك من موقع الويب الخاص 
بك ويقصد بها معدلات الأشخاص الذين بدأو عملية التحرك ف الموقع ثم قاموا بإنهائهاء أو 
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وصلوا إلى موقع الويب الخاص بك وتركوه بعد صفحة أو اثنتين. ففي الحالة الأولى» ستحتاج 
إلى تحليل المكان الذي أنهى فيه الزائر العملية وما إذا كان هناك عدد من الزائرين يغادرون 
في المكان نفسه. ومن نّم التحقيق في الوضع من أجل اتخاذ القرار. وفي الحالة الأخيرة يشير 
معدل الخروج المرتفع من موقع ويب أو صفحة ما بشكل عام إلى وجود مشكلة في التوقعات. 
ويقوم الزائرون بالنقر على موقع الويب الخاص بك استنادًا إلى بعض الرسائل الواردة في الإعلان» 
والعرض التقديميء وما إلى ذلك» ومن المتوقع استمرار هذه الرسالة بعض الوقت. وينبغي عليك 
أن تتأكد من أنك تعلن الرسالة التي يستطيع موقعك على الويب أن يعززها ويسلمها. 
ويتضمن كل بند من هذه العناصر مقاييس يمكن إنشاؤها لمؤسستك. كما يمكنك إنشاء 
لوحة معلومات أسبوعية تتضمن أرقامًا أو نسبًا محددة تشير إلى المكان الذي تنجح فيه - 
أو تسلط الضوء على التحدي التسويقي الواجب معالجته. وعندما يتم تقييم هذه المقاييس 
باستمرار واستخدامها مرتبطةً ببيانات تسويقية أخرى dela‏ فمن الممكن أن يقودك ذلك إلى 
برنامج تسويق كمي للغاية. ويعرض الشكل )١6-0(‏ لوحة تحكم في تحليلات الويب تم إنشاؤها 
باستخدام أدوات وعناترلهصةى عاعه0هك المتاحة مجانًا. 
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أسئلة مراجعة على القسم 1-0: 

-١‏ ما هي الأنواع الثلاثة للبيانات التي يتم توليدها من خلال زيارات صفحة الويب؟ 
-١‏ ما هو تحليل مسار النقر؟ وفيم يستخدم؟ 

*- ما هي التطبيقات الرئيسة للتنقيب في الويب؟ 

-٤‏ ما هي مقاييس تحليلات الويب شائعة الاستخدام؟ وما أهمية المقاييس؟ 


٠٠-٥‏ التحليلات الاجتماعية: 

يتفاوت معنى التحليلات الاجتماعية من شخص لآخر, وفقاً لنظرته إلى العالم» وإلى مجال 
دراسته. فعلى سبيل المثال» يشير تعريف القاموس للتحليلات الاجتماعية إلى وجهة نظر فلسفية 
وضعها المؤرخ والفيلسوف الدمارق غلنصطط5 عل1مع1.2:5-11 في تمانينيات القرن العشرين. 
ويعد الهدف النظري من وجهة النظر هذه هو زهي وهو نوع من ”الشمولية“ التي لا تمثل 
حسابًا عالميًا ولا مشاركة مجتمعية بين كل عضو في كيان (Schmidt. 1996) la‏ وهكذاء تختلف 
التحليلات الاجتماعية عن كل من الفلسفة التقليدية وعلم الاجتماع والتي قد ينظر إليها على أنها 
المحاولات الرامية إلى توضيح الخلاف بين الفلسفة وعلم الاجتماع. 

ويختلف تعريفنا للتحليلات الاجتماعية إلى حد ما. فبدلًا من التركيز على الجزء «الاجتماعي» 
(كما هو الحال في التعريف الفلسفي له). فنحن نهتم أكثر بجزء «التحليلات» في المصطلح. وقد 
Gartner 4$ 5 cal‏ )13( $55 استشارية عالمية معروفة في مجال تقنية المعلومات) بتعريف 
التحليلات الاجتماعية على أنها «رصد وتحليل وضبط وتفسير التفاعلات الرقمية والعلاقات بين 
الأشخاص والمواضيع والأفكار والمحتوى» gartner.com/it-glossary/social-analytics/)‏ 
وتشمل التحليلات الاجتماعية التنقيب في محتوى النص الذي تم إنشاؤه في وسائل التواصل 
الاجتماعي (مثل تحليل المشاعرء ومعالجة اللغات الطبيعية 211.7) وتحليل الشبكات الاجتماعية 
to)‏ تحديد المؤثرء والتنميط, والتنبؤ) وذلك بغرض الحصول على إحصاءات حول السلوكيات 
الحالية وا مس تقبلية للعملاء الحاليين والمحتملين» وحول شعورهم بالإعجاب أو عدم الإعجاب 
تجاه منتجات وخدمات الشركة. واستنادًا إلى هذا التعريف والممارسات الحالية: يمكن تصنيف 
التحليلات الاجتماعية إلى فرعين مختلفين - غير أنه ليس بالضرورة أن يكون هذين الفرعين 
حصريين - وهما: تحليل الشبكات الاجتماعية (5714) وتحليلات وسائل التواصل الاجتماعي. 
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تحليل الشبكة الاجتماعية: 
تعتبر الشبكة الاجتماعية هيكل اجتماعي يتكون من أفراد / أشخاص (أو مجموعات من 
الأفراد أو المنظمات) ترتبط ببعضها البعض بنوع من الروابط / العلاقات؛ حيث يقدم منظور 
الشبكة الاجتماعية طريقة شاملة لتحليل بنية وديناميكيات الكيانات الاجتماعية. وتستخدم 
دراسة هذه الهياكل نظام الحسابات القومية لتحديد الأنماط ا محلية والعامميةء وتحديد الكيانات 
المؤثرة. ودراسة ديناميكية الشبكة. والجدير بالذكر أن الشبكات الاجتماعية وتحليلها هي في 
الأماس مجال متعدد التخصصات نشأ من علم النفس الاجتماعيء وعلم الاجتماع؛ والإحصاءات» 
ونظرية الرسم البياني. ويعود تاريخ تطوير وإضفاء الطابع الرسمي على المدى الرياضي لنظام 
الحسابات القومية إلى الخمسينيات» في حين أن تاريخ تطوير النظريات والأساليب الأساسية 
للشبكات الاجتماعية يعود إلى ثمانينيات القرن العشرين(2003 pla asg (Scott & Davis,‏ 
الحسابات القومية الآن واحداً من النماذج الرئيسة ف تحليلات الأعمالء وذكاء المستهلك وعلم 
الاجتماع المعاصرء كما يستخدم أيصًا في عدد من العلوم الاجتماعية والرسمية الأخرى. 
إن الشبكة الاجتماعية هي بنيان نظري مفيد في العلوم الاجتماعية لدراسة العلاقات بين 
الأفراد والجماعات والمنظمات» أو حتى مجتمعات بأكملها (الوحدات الاجتماعية). ويستخدم 
المصطلح لوصف البنية الاجتماعية التي تحددها مثل هذه التفاعلات. حيث تمثل الروابط التي 
ترتبط بها أي وحدة اجتماعية معينة تقارب مختلف جهات التواصل الاجتماعي لتلك الوحدة. 
وبشكل عام, فإن الشبكات الاجتماعية ذاتية التنظيم, ناشئة ومعقدة, بحيث يظهر نمط متماسك 
عابليًا من التفاعل المحلي للعناصر (الأفراد ومجموعات الأفراد) التي تشكل النظام. 
وفيما يلي بعض أنواع الشبكات الاجتماعية النموذجية المرتبطة بأنشطة الأعمال: 
- شبكات الاتصالات: تُعتبر دراسات الاتصال في الغالب جزءًا من كلّ من العلوم الاجتماعية 
والإنسانيةء وتعتمد إلى حد كبير على مجالات Jio‏ علم الاجتماع وعلم النفس وعلم الإنسان 
(الأنثروبولوجي) وعلم المعلومات والأحياء (البيولوجي) والعلوم السياسية والاقتصاد. وتفيد 
العديد من مفاهيم الاتصالات في وصف عملية نقل المعلومات من مصدر إلى آخر وبالتالي يمكن 
تمثيلها كشبكة اجتماعيةء حيث تستفيد شركات الاتصالات من هذا المصدر الغني بالمعلومات 
لتحسين ممارسات الأعمال الخاصة بها وكذلك تحسين علاقات العملاء. 
- شبكات المجتمع: يشير مصطلح المجتمع تقليديًا إلى موقع جغرافي معين» وكانت دراسات العلاقات 
ا مجتمعية تتعلق بمن تحدثواء وترابطواء وتاجرواء وحضروا نشاطات اجتماعية مع بعضهم البعض. 
ومع ذلك» هناك اليوم مجتمعات ”إلكترونية“ موس عة تم تطويرها من خلال أدوات التواصل 
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لاجتماعي وأجهزة الاتصالات. مثل هذه الأدوات والأجهزة تنتج باستمرار كميات كبيرة من 
لبيانات» والتي يمكن استخدامها من قبل الشركات لاكتشاف معلومات نفيسة وقابلة للتطبيق. 
- الشبكات الإجرامية: في علم الجرية وعلم الاجتماع المدني» تم توجيه اهتمام كبير للشبكات 
لاجتماعية من بين الممثلين الإجراميين. Fiad‏ قد تؤدي دراسة جرائم القتل التي تقوم 
بها العصابات والأنشطة غير القانونية الأخرى - باعتبارها سلسلة من عمليات التناوب بين 
لعصابات - إلى فهم أفضل لهذه الأنشطة الإجرامية ومن ثم العمل على منعها. والآن وبعد 
أن أصبحنا نعيش في عام مترابط إلى حد كبير (بفضل الإنترنت)» تقوم وكالات الأمن بمراقبة / 
متابعة الكثير من تشكيلات الشبكات الإجرامية وأنشطتها باستخدام أدوات وتكتيكات الإنترنت 
الحديثة. وعلى الرغم من أن الإنترنت قد غيّر شكل شبكات الإجرام والوكالات المنوطة بتطبيق 
القانونء إلا أن النظريات الاجتماعية والفلسفية التقليدية لا تزال تطبق إلى حد كبير. 

- شبكات الابتكار: تركز دراسات الأعمال على نشر الأفكار والابتكارات في بيئة الشبكات على انتشار 
لأفكار واستخدامها بين أعضاء الشبكة الاجتماعية. وتكمن الفكرة في فهم سبب كون بعض الشبكات 
أكثر إبداعاء وماذا تتبنّى بعض المجتمعات تلك الأفكار والابتكارات في وقت مبكر (مثل دراسة أثر 
هيكل الشبكة الاجتماعية في التأثير على انتشار الابتكار والسلوك الإبداعي). 





مقاييس تحليل الشبكة الاجتماعية: 
إن نظام تحليل الشبكة الاجتماعية 5×4 هو الفحص المنتظم للشبكات الاجتماعية. وينظر نظام 
تحليل الشبكة الاجتماعية إلى العلاقات الاجتماعية من حيث نظرية الشبكةء والتي تتكون من iE‏ 
685 (تمثل الأفراد أو المنظمات داخل الشبكة) والعلاقات / الاتصالات (التى تمثل العلاقات بين 
الأفراد أو المنظمات» مثل الصداقة أو القرابة أو الوضع التنظيمي). وغالبًا ما يتم تمثيل هذه الشبكات 
باستخدام الرسوم البيانية للشبكة الاجتماعية. حيث يتم تمثيل العُقد (نقاط الالتقاء) كنقاط ويتم تمثيل 
الروابط كخطوط. وتقدم الحالة العملية (6-0) مثالًا مثيرًا للتحليلات الاجتماعية متعددة القنوات. 
حالة عملية A-0‏ 
فودكا تيتو تؤسس الولاء للعلامة التجارية بإستراتيجية اجتماعية حقيقية 
إذا كان على الفودكا المصنوعة يدويًا من تيتو ١٤آ‏ تحديد مقياس واحد لوسائل 
التواصل الاجتماعي يعكس مهمتها بدقة أكبر. فربما يكون المشاركة. إن التواصل مع 
محبي الفودكا بطريقة شاملة وأصيلة هو أمر تأخذه تيتو 13160 بجدية بالغة. وتعكس 
الإستراتيجية الاجتماعية للعلامة التجارية تلك الرؤية. 
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وقد كان تأسيسها منذ ما يقرب من عقدين من الزمانء وقد ساعد ظهور وسائل 
التواصل الاجتماعي في تعزيز العلامة التجارية من خلال لعب دور أساسي في إشراك 
الجمهور وزيادة الوعي بالعلامة التجارية. وفي مقابلة مح صاحب اممشروع» ذكر 
أن 86961086 8616 مؤسس شركة تيتو «11]0“. قد نسب الفضل لوسائل التواصل 
الاجتماعي لتمكينه من التنافس على مساحة العرض على الرفوف مع علامات تجارية 
أخرى للخمور أكثر شهرة. حيث قال 869611086 لصاحب المشروع: ”وسائل التواصل 
الاجتماعي هي منصة كبيرة للترويج لعلامة تجارية من خلال الكلمة الشفوية. لأنها 
ليست فقط لمن لديه آكبر مكبر للصوت“. 

ومع نضج شركة تيتو 1310 ظل الفريق الاجتماعي مخلصًا للقيم التأسيسية للعلامة 
التجارية ويستخدم Twitter go Ý‏ و 1051380 بنشاط لإجراء محادثات فردية 
وتواصل مع المتحمسين للعلامة التجارية. وقالت 5©2ندتهط[»© 16809 منسقة شبكة 
الإنترنت ووسائل التواصل الاجتماعي: ”نحن م ننظر أبدًا لوسائل التواصل الاجتماعي 
على اعتبار أنها وسيلة أخرى للإعلان“. وتابعت: ”نحن موجودون على هذه الوسائل 
الاجتماعية حتى يتمكن عملائنا من التحدث إلينا“. 

وللوصول لهذه النهاية تستخدم تيتو 11340 وسائل التواصل الاجتماعي الحديثة 
لفهم جو الصناعة. وتطوير علامة تجارية اجتماعية متسقة. وإنشاء حوار مع جمهورها. 
ونتيجة لذلكء. فقد قامت تيتو 19310 بتنمية مجتمعاتها عضويًا على كل من :110116" 
بنسبة XEY,O‏ و105]8810 بنسبة 11,7 وذلك في غضون 6 أشهر. 


Titos O iet 


sproutsocial 
+ 


Titos 


Handmade 








الإخبار بإستراتيجية التسويق الموسمية المتكاملة: 

يمثل برنامج كوكتيل الربع سنوي لتيتو 11٥‏ جزءًا رئيس ا من إستراتيجية التسويق 
المتكاملة للعلامة التجارية؛ حيث يتم تطوير وصفة كوكتيل في كل ربع سنة وتوزيعها 
من خلال مبادرات التسويق عبر الإنترنت في „Tito g5‏ 
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ومن امهم بالنسبة لتيتو Tito‏ ضمان توافق الوصفة مع تركيز العلامة التجارية فضلًا 
عن الاتجاه إلى صناعة أكبر. ولذلك. تستخدم Gelhausen‏ الكلمات المفتاحية لعلامة 
1011م طراقبة اتجاهات الصناعة وملفات تعريف نكهة الكوكتيل. تقول معدنتقطاء0: 
lof Sprout jee 965 AU"‏ مهمة جدًا للرصد الاجتماعي. ويُعد 1000 طريقة جيدة 
للاحتفاظ بأعلى علامات التصنيف والاطلاع على المؤشرات العامة في جدول واحد“. 


ويتم تقديم هذه الدروس إلى فريق عمل المزيج الداخلي في تيتو 1110 واستخدامها لضمان 
توصيل نفس الوصفة الربع سنوية إلى فريق مبيعات العلامة التجارية وعبر قنوات التسويق. 
تقول :Gelhausen‏ ”سواء کنت تشرب تيتو 1110 في البار أو تشتريه من متجر لبيع الخمور 
أو تتابعنا على مواقع التواصل الاجتماعي فإنك تحصل على نفس الكوكتيل الربع سنوي“. 

يضمن البرنامج حصول الشخص على تجربة متسقة للعلامة التجاريةء في كل نقطة 
اتصال للمستهلك» وهذ! الاتساق أمر حيوي. وف الواقع» فإنه وفقًا لدراسة أجرتها شركة 
omnichannel Us353 (2l (35 2] à ,25 Js 2 Infosys‏ فإن 6" من المستهلكين 
يرون أن الاتساق بين القنوات هو سبب إنفاقهم أكثر مع علامة تجارية. وعلى الجانب 
الآخر ذكر 19 أن التناقض يُعد سببًا كافيًا لإنفاق مبالغ أقل. 

ويبدأ جمع رؤى الصناعة في شركة تيتو 1110 بمراقبة اجتماعية على Twitter‏ 
و stagram‏ من خلال 10116م5. غير أن الإستراتيجية الاجتماعية للعلامة التجارية لا 
تتوقف عند هذا الحدء حيث تستخدم تيتو 11]0' النظام الأساسي بشكل يومي للتواصل 
فعليًا مع عملائها. مع الحفاظ على جذورها. 

ويقوم صندوق البريد الذكي في 04ا20:م5 بعرض حسابات Instagrams Twitter‏ 
الخاصة بتيتو 110 في خلاصة واحدة ومتماسكة. مما يساعد 2عكننهطا على إدارة 
الرسائل الواردة والتحديد بشكل سريع أي منها يتطلب استجابة. 

يقول 153115652 6©: “يتيح لنا برنامج 0116م5 البقاء على اتصال دائم بالمحادثات 
التي نجريها مع متابعينا. وأنا أحب إمكانية التفاعل بسهولة مع المحتوى من حسابات 
متعددة في مكان واحد". 

انتشار الكلمة على تويتر: 

وتُعد الطريقة التي تتبعها تيتو 110 على تويتر بسيطة. حيث إنها تتمثل في 
الانخراط في محادثات شخصية فردية مع المعجبين. ويعد الحوار قوة دافعة للعلامة 
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التجاريةء وعلى مدار 6 أشهرء كانت نسبة ۸۸ من التغريدات التي تم إرسالها تمثل 
ردودًا على الرسائل الواردة. 

وقد أدى استخدام :©1114' كخط اتصال بين تيتو 1310" ومعجبيها إلى زيادة التفاعل 
بنسبة #371,7, بالإضافة إلى زيادة المتابعين بنسبة 0,اع/. وما يثير الإعجاب أكثر هو 
إنهاء تیتو 11۲٥‏ هذا الربع السنوي بواقع 0۳۸,٠١١‏ انطباعًا من الأعضاء - وهو ارتفاع 
بنسبة .#8١‏ كما يتم تطبيق إستراتيجية مشابهة على 2هة:ع105]2, حيث تستخدمها 
تيتو 11٠0‏ لتعزيز وتقوية العلاقة مع المعجبين وذلك من خلال نشر الصور ومقاطع 
الفيديو لأفكار الوصفات الجديدة وأحداث العلامة التجارية والمبادرات. 

الاستيلاء على الحفل على instagram‏ 

تقوم تيتو 1110 في الأماس بنشر محتوى نمط الحياة على 106188219 وتشجع 
المتابعين لدمج العلامة التجارية في المناسبات اليومية. كما تستخدم تيتو 1110 أيضًا 
النظام الأماسي للترويج لجهودها التسويقية ولإخبار قصة علامتها التجارية. ويعثر 
الفريق على قيمة في تقرير 1051385312 الخاص ب 5010116: والتي تساعدهم على 
تحديد أكثر الأشياء التي تحظى بالمشاركة على وسائل التواصل وتلقي أكبر قدر من 
التفاعل وتحليل تركيبة الجمهور ومدى زيادتهم. والغوص في أنماط النشر بشكل أعمق, 
وتقييم :Gelhausen Jg oual lis ġo jola (hashtag) e. 3l slol‏ ”في ضوء 
الخلاصة المخصصة الجديدة في <تة2عة]155. من المهم أن ننتبه مما يحدث بالفعل“. 

وقد جمكنت تيتو Tito‏ باستخدام تقرير 105128212 من قياس أثر إستراتيجيتها 
التسويقية صتهمرعة)5م1 وتعديل مقاربتها وفقًا لذلك. ومن خلال استخدام الشبكة 
كطريقة أخرى للتفاعل مع اممعجبين» تت علامتها التجارية بشكل مطرد مع نمو جمهورها. 
ونی غضون ٤‏ أشهر شهدت 11۲٥۷0۵4۸4۵‏ زيادة في المتابعين بنسبة #11,5, وزيادة في 
التفاعل بنسبة ١,/ا!#.‏ كما حصل كل محتوى منشور على متوسط ع0 تفاعلًا. كما نما 
الوسم (251188) الخاص بالعلامة التجارية 772097001#لصهط1]05] بنسبة 7" 


من هنا يؤدي إلى أين؟ 

تعد وسائل التواصل الاجتماعي استثمارًا متواصلًا في الوقت والاهتمام. وستواصل 
Tito s z5‏ النشاط الذي شهدته علامتها التجارية من خلال تقسيم كل ربع سنة 
في حملتها Sl eas Lalo o 29" :Gelhausen Js à à Lol‏ 3 ذكاءً من خلال 
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التحليلات التنبؤية :)١(‏ تحليلات النص والويب ووسائل التواصل الاجتماعي 


إستراتيجياتنا الاجتماعية ونحرص على أن يكون ما ننشره ملامًا ونتلقى صداه“. وسيظل 
استخدام التواصل الاجتماعي مع المعجبين بطريقة ثابتة وأصلية ولا تنسى حجر الزاوية 
في جهود التسويق الرقمي للعلامة التجارية. وستواصل تيتو 110 تعزيز مجتمع محبيها 
elaszab .loyalists‏ مجموعة أدوات إدارة وسائل التواصل الاجتماعي في غ1010م5. 











- توجد زيادة بنسبة 177“ في التفاعل الأساسي على 115 
- وزيادة بنسبة “8١‏ في الانطباعات الأساسية على 101067. 
- وزيادة بنسبة <١۷‏ في التفاعل على Instagram‏ 
أسئلة للمناقشة: 
-١‏ كيف يمكن استخدام تحليلات وسائل التواصل الاجتماعي في صناعة المنتجات 
الاستهلاكية؟ 
-Y‏ ما هي في رأيك التحديات الرئيسة والحلول والنتائج المحتملة لتطبيق تحليلات 
وسائل التواصل الاجتماعي على المنتجات الاستهلاكية وشركات الخدمات؟ 
Source: SproutSocial Case Study, “Titos Vodka Establishes Brand insights/case-‏ 
studies/titos/(accessed July 2016).‏ 
ورور الأعوام» تم تطوير مقاييس (أو قياسات) مختلفة لتحليل هياكل الشبكات الاجتماعية 
من وجهات نظر مختلفة. وغالبًا ما يتم تجميع هذه المقاييس ضمن ثلاث فئات: الروابط 
والتوزيعات والتقسيم إلى قطاعات. 
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الروابط: 

حب الأشياء المتشابهة: وهو مدى قيام الجهات الفاعلة بتشكيل روابط مع آخرين بينهم 
تشابه مع غيرهم ممن يختلفون عنهم. ويمكن تعريف التشابه حسب الجنس أو النسب أو 
العمر أو المهنة أو التحصيل العلمي أو الحالة أو القيم أو أي سمة بارزة أخرى. 

التعدد: وهو عدد من نماذج المحتوى المضمنة في رابطء مثل: شخصين من الناس» وهما صديقانء 
بالإضافة إلى أنهما يعملان معًا مجموعة متعددة من اثنين. يرتبط التعدد بقوة العلاقة. 

تبادل العواطف / المعاملة بالمثل: هو مدى قيام اثنين من الممثلين بتبادل علاقات الصداقة أو 
غيرها من التفاعلات بين كل منهما. 

إغلاق الشبكة: وهو مقياس لإكمال العلاقات الثلاثيةء حيث إن افتراض الفرد لإغلاق الشبكة 
(أي أن أصدقاء أصدقائه هم أصدقاؤه أيضًا) يسمى التعدي ,إا۷ءدة1۲. والتعدي هو نتيجة 
للخاصية الفردية أو الظرفية للحاجة إلى الإغلاق الإدراي. 

التجاور: وهو الميل للحصول على مزيد من الروابط مع الآخرين ذوي الموقع الجغرافي المقرب. 


التوزيعات: 

الجسر: وهو الشخص الذي هلأ فجوة هيكلية عن طريق روابطه الضعيفة؛ وهو الذي يوفر 
الرابط الوحيد بين فردين أو مجموعة. كما يتضمن أيضًا أقصر الطرق عندما يكون ال مدى الأطول 
غير ممكن بسبب وجود خطر كبير لتشويه الرسائل أو فشل التسليم. 

المركزية: وتشير إلى مجموعة من المقايبس التي تهدف إلى تحديد أهمية أو تأثير (في مجموعة 
متنوعة من الحواس) عقدة معينة (أو مجموعة) داخل الشبكة. ويوجد عدة طرق لقياس 
ا مركزية من أشهرها المركزية البينيةء ومركزية التقارب» ومركزية القيمة الذاتيةء ومركزية ألفاء 
بالإضافة إلى مركزية الدرجة. 

الكثافة: وهي نسبة الروابط المباشرة في الشبكة بالنسبة إلى العدد الإجمالي الممكن. 

المسافة: وهي الحد الأدنى لعدد الروابط ال مطلوبة لربط جهتين محددتين. 

الثقوب الهيكلية: وهي غياب الروابط بين جزئين من الشبكة. حيث إن العثور على ثقب 
هيكلي واستغلاله من الممكن أن يؤدي إلى منح صاحب المشروع ميزة تنافسية. وقد تم تطوير 
هذا المفهوم من قبل عام الاجتماع Burt‏ 202314 ويشار إليه أحيانًا على أنه مفهوم بديل لرأس 
المال الاجتماعي. 
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التحليلات التنبؤية (؟): تحليلات النص والويب ووسائل التواصل الاجتماعي 


قوة الربط: وتعرف بأنها مزيج خطي من الوقتء والكثافة العاطفيةء والحميميةء وا معاملة 
با مثل (أي التبادلية). وتترابط العلاقات القوية بكل من حب الأشياء المتشابهة: والتجاورن 
والتعديء في حين تترابط العلاقات الضعيفة مع الجسور. 


التقسيم إلى قطاعات: 

الزُمَر والدوائر الاجتماعية: ويتم تعريف المجموعات على أنها زمر إذا كان كل فرد مرتبطًا 
بشكل مباشر بجميع الدوائر الفردية أو الاجتماعية الأخرى مع مستوى صرامة أقل من الاتصال 
Mag c SUI‏ تعريف غير دقيق» أو تعرف على أنها مجموعات متماسكة هيكليًا في حالة الرغبة 
à‏ مستوى دقة أكبر. 

معامل التجميع ja gàs 05$ Jloxo oos sas :(Clustering Coefficient)‏ العقدة 
مرتبطين. ويشير معامل التجميع الأعلى إلى درجة أكبر من الطائفية. 

التماسك: وهو مدى ارتباط الممثلين مباشرة ببعضهم البعض عن طريق روابط متماسكة. 
ويشير التماسك الهيكلي إلى الحد الأدنى لعدد الأعضاء الذين إذا تمت إزالتهم من مجموعة ما فإن 
ذلك من شأنه أن يؤدي إلى فك المجموعة. 


تحليلات وسائل التواصل الاجتماعي: 

تشير وسائل التواصل الاجتماعي إلى التقنيات اللواتية للتفاعلات الاجتماعية بين الأشخاص 
الذين يقومون بإنشاء ومشاركة وتبادل المعلومات والأفكار والآراء في المجتمعات والشبكات 
الافتراضية» وهي عبارة عن مجموعة من تطبيقات البرامج المستندة إلى الإنترنت والتي تعتمد 
على الأسس الأيديولوجية والتقنية للويب ۲١‏ التي تسمح بإنشاء وتبادل المحتوى الذي ينشئه 
(Kaplan & Haenlein, 2010) esc LL‏ وتعتمد وسائل التواصل الاجتماعي على تقنيات 
المحمول وغيرها من التقنيات القائمة على الويب لإنشاء منصات تفاعلية بشكل قوي للأفراد 
والمجتمعات لمشاركة ال محتوى الذي ينشئه المستخدم وإنشاء المحتوى ومناقشته وتعديله. كما 
أنها تقدم تغييرات كبيرة في التواصل بين المنظمات والمجتمعات والأفراد. 

ومنذ ظهورها في أوائل التسعينيات شهدت تقنيات الشبكات الاجتماعية القائمة على الويب 
تحستًا S‏ في كل من الجودة والكمية. وتتخذ هذه التقنيات العديد من الأشكال المختلفة, 
ها في ذلك المجلات عبر الإنترنت» ومنتديات الإنترنتء وسجلات الويبء والمدونات الاجتماعية, 
والمدونات الصغيرةء والويكي» والشبكات الاجتماعية» والحلقات الصوتية 002515م» galg‏ 
والفيديوء وتقييمات / تصنيفات المنتجات / الخدمات. ومن خلال تطبيق مجموعة من النظريات 
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في مجال أبحاث وسائل التواصل (الحضور الاجتماعيء ثراء وسائل التواصل) والعمليات الاجتماعية 

(التقديم الذاقيء والإفصاح الذاقي). أنضاً كل من «داصه! وهذعلم »112 (2010) نظام تصنيف 

لوسائل التواصل الاجتماعي بست أنواع مختلفة منها : )١(‏ المشاريع التعاونية (مثل ويكيبيديا» 

(؟) مدونات والمدونات الصغيرة (مثل (F) (ig‏ مجتمعات المحتوى (مثل: يوتيوب).: )٤(‏ 

مواقع الشبكات الاجتماعية (مثل هه طاءءة۴)» (0) عام الألعاب الافتراضية (مثل: fه‏ ۷0114 

ese (0 «(Warcraft‏ اجتماعية افتراضية (مثل: عكذنآ 0همء56). 

وتختلف وسائل التواصل الاجتماعي القائمة على الويب عن وسائل التواصل التقليدية / الصناعية, 

مثل الجرائد والتلفاز, والأفلام» حيث إنها رخيصة نسبيًا ويمكن الوصول إليها لتمكين أي شخص 

(حتى الأفراد العاديين) من نشر أو الوصول إلى / استهلاك المعلومات. وتتطلب وسائل التواصل 

الصناعية عمومًا موارد مهمة لنشر المعلومات. حيث إن المقالات (أو الكتب) تمر في معظم 

الحالات بالعديد من التنقيحات قبل نشرها. وفيما يلي بعض الخصائص الأكثر انتشارًا التي تساعد 

على التمييز بين وسائل التواصل الاجتماعي والصناعي (2010 :(Morgan, Jones, & Hodges,‏ 

- الجودة: ففي مجال النشر الصناعي - بواسطة ناشر - فإن النطاق النموذجي للجودة يكون 
أضيق بشكل جوهري من الأسواق المتخصصة غير المغطاة. ويتمثل التحدي الرئيس الذي هثله 
المحتوى في مواقع الشبكات الاجتماعية في حقيقة أن توزيع الجودة له تباين كبير: من عناصر 
عالية الجودة إلى محتوى منخفض الجودة: وأحيانًا مُسيء. 

- الوصول: توفر كل من تقنيات وسائل التواصل الصناعي والاجتماعي نطاقًا واسعًا وقادرًا على 
الوصول إلى جمهور عالمي. ومع ذلك فعادةً ما تستخدم وسائل التواصل الصناعي إطارًا مركزيًا 
للتنظيم والإنتاج والنشر في حين أن وسائل التواصل الجتماعي بطبيعتها أكثر لامركزية وأقل 
تسلسلًا وتميرًا بنقاط متعددة للإنتاج والمنفعة. 

- التكرار: حيث إن تحديث وإعادة النشر على منصات وسائل التواصل الاجتماعي يُعد أسهل 
وأسرع وأرخصء وذلك بالمقارنة مع وسائل التواصل الصناعية وبالتالي فإنه يمارس بشكل أكثر 
تكرارًاء مما يؤدي إلى الحصول على محتوى أعذب. 

- إمكانية الوصول: عادةً ما تكون وسائل الإنتاج الخاصة بوسائل التواصل الصناعية حكومية و / 
أو شركات (مملوكة ملكية خاصة) ومكلفة» في حين أن أدوات وسائل التواصل الاجتماعي متاحة 
للجمهور بشكل عام بتكلفة قليلة أو بدون تكلفة. 

- سهولة الاستخدام: يتطلب إنتاج وسائل التواصل الصناعية عادةً مهارات متخصصة وتدريب. 
وعلى العكس من ذلكء فإن معظم إنتاج وسائل التواصل الاجتماعي لا يتطلب سوى إعادة 
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تفسير متواضع للمهارات القائمة؛ ومن الناحية النظرية» فإن أي شخص لديه إمكانية, يستطيع 
تشغيل وسائل إنتاج وسائل التواصل الاجتماعي. 

- فورية: قد يكون الفارق الزمني بين الاتصالات التي تنتجها وسائل التواصل الصناعية طويلًا 
(أسابيع أو شهور أو حتى سنوات) مقارنة بوسائل التواصل الاجتماعي (التي هكن أن تكون 
قادرة على الاستجابة بصورة فورية تقريبًا). 

- قابلية التحديث: لا يمكن تغيير وسائل التواصل الصناعية بمجرد إنشائها (بمجرد طباعة مقالة 
المجلة وتوزيعهاء ولا يمكن إجراء تغييرات على نفس اللقالة)» في حين يمكن تغبير وسائل التواصل 
الاجتماعي على الفور تقريبًا من خلال التعليقات أو التحرير. 


كيف يستخدم الناس وسائل التواصل الاجتماعي؟ 

لا يقتصر نمو مواقع الشبكات الاجتماعية على عددها فحسب بل تنمو أيضًَا درجة ارتباطها 
بالقناة. وقد قدم كل من 80822 وع835]100 (2011) نتائج بحث تقسم المستخدمين حسب مدى 
نشاطهم في استخدام وسائل التواصل الاجتماعي والتطور المتتبع لهذه القطاعات من المستخدمين 
بمرور الوقت. وقد أدرجوا ستة مستويات مشاركة مختلفة (الشكل (Y0-0‏ 











مستوى إرتباط وسائل التواصل الاجتماعى 


| 








شكل 10-0: تطور مشاركة مستخدم وسائل التواصل الاجتماعي 

ووفقًا لنتائج البحثء فقد كان مجتمع المستخدمين عبر الإنترنت يتحول بشكل متزايد باتجاه 
المشاركة هرمية الشكل. والتغير الملحوظ بشدة هو الحادث فيما بين غير النشطين» حيث تضم 
هذه الفئة ٤٤‏ من مستخدمي الإنترنت. وبعد ذلك بعامينء قفز أكثر من نصف هؤلاء الخاملين 
إلى وسائل التواصل الاجتماعي بشكل أو بآخر. وقد أشار عده:5ة8 إلى أن: ”الآن حوالي 1417 
من مس تخدمي الإنترنت البالغين ضمن واحدة من الفئات العلياه لقد وصلت وسائل التواصل 
الاجتماعي إلى Ji‏ من التبنّي الجماعي“. 
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Bastone Jg‏ ”“تشير وسائل التواصل الاجتماعي إلى الطرق المنهجية والعلمية لاستهلاك 
الكمية الهائلة من المحتوى الذي أنشأته وسائل التواصل الاجتماعي على شبكة الإنترنت» والأدوات 
والتقنيات من أجل تحسين قدرة المؤسسة على المنافسة. وقد أصبحت تحليلات وسائل التواصل 
الاجتماعي قوة جديدة في المنظمات حول العام بشكل سريع» مما يسمح لها بالوصول إلى 
المستهلكين وفهمهم كما لم يحدث من قبل. وبالإضافة إلى ذلك» فقد أصبحت وسائل التواصل 
الاجتماعي في العديد من الشركات. أداة للإستراتيجيات المتكاملة للتسويق والاتصالات. 

يوفر النمو الهائل لوسائل التواصل الاجتماعى» من المدونات» «jugis «Facebook‏ 
LinkedIn J!‏ ويوتيوب» وأدوات التحليلات التي تسفيد من هذه المصادر الغنية بالبيانات» 
للمنظمات فرصة الدخول في محادثات مع ملايين العملاء حول العام كل يوم. وهذه ال ميزة هي 
السبب في أن ما يقرب من ثلثي الشركات ال ٠١٠١‏ التي شاركت في دراسة استقصائية حديثة - أجرتها 
هارفارد بيزنس ريفيو أناليتيكس سيرفيسز (Harvard Business Review Analytic Services)‏ 
- قالوا إنهم إما ييستخدمون حاليًا قنوات وسائل التواصل الاجتماعي أو لديهم خطط وسائل 
التواصل الاجتماعي في (Harvard Business Review, 2010) JU. eSI‏ ولكن ما زال الكثيرون 
يقولون إن وسائل التواصل الاجتماعي هي تجربة» حيث يحاولون فهم كيفية الاستخدام الأمثل 
للقنوات ا مختلفة. وقياس فعاليتهاء ودمج وسائل التواصل الاجتماعي في إستراتيجيتهم. 


قياس تأثير وسائل التواصل الاجتماعي: 
بالنسبة للمؤسسات - سواء كانت صغيرة أو كبيرة - فهناك إحصاءات قيّمة مخفية داخل 
المحتوى الذي أنشأه الممستخدم على مواقع التواصل الاجتماعيء ولكن كيف كنك أن تبرزها 
من بين عشرات مواقع المراجعة وآلاف المدونات والملایین من مشارکات ٥00)‏ ط۴۵۲ وملايين 
التغريدات؟ وإذا أمكنك القيام بذلك. فكيف تقيس تأثير جهودك؟ وهذه الأسئلة يمكن معالجتها 
من خلال تمديد التحليلات لتقنيات وسائل التواصل الاجتماعي. وبمجرد أن تحدد هدفك من 
وسائل التواصل الاجتماعي (ما تريد تحقيقه)» فإن هناك العديد من الأدوات لمساعدتك على 
الوصول إلى هذا الهدفء وهذه الأدوات التحليلية تقع عادةً في ثلاث فئات واسعة: 
- التحليلات الوصفية: تستخدم إحصائيات بسيطة لتحديد خصائص واتجاهات النشاط مثل 
عدد اممتابعين لديك» وعدد المراجعات التي تم إنشاؤها على kههطاءء۴4‏ والقنوات التي يتم 
استخدامها في أغلب الأحيان. 
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- تحليل الشبكات الاجتماعية: تتبع الروابط بين الأصدقاء والمعجبين والمتابعين لتحديد روابط 
التأثير بالإضافة إلى أكبر مصادر التأثير. 
- التحليلات المتقدمة: تتضمن تحليلات تنبؤية وتحليلات النصوص التي تدرس ال محتوى في 
المحادثات عبر الإنترنت لتحديد المواضيع والمشاعر والارتباطات التي لن يتم الكشف عنها من 
خلال المراقبة العرضية. 
وتستخدم الأدوات والحلول المتطورة لتحليلات وسائل التواصل الاجتماعي جميع فئات 
التحليلات الثلاث (أي: وصفية» تنبؤية» وقائية) بطريقة تدريجية إلى حد ما. 


أفضل الممارسات في تحليلات وسائل التواصل الاجتماعي: 

باعتبارها أداة ناشئة» فإن تحليلات وسائل التواصل الاجتماعي تمارس من قبل الشركات بطريقة 
عشوائية بعض الشيء. ونظرًا لعدم وجود منهجيات راسخة. فإن الجميع يحاولون إنشاء منهجياتهم 
الخاصة عن طريق التجربة والخطأ. وفيما يلي بعض أفضل الممارسات التي تم اختبارها ميدانيًا لتحليلات 
وسائل التواصل الاجتماعي التي Chavess Paine (ya JS la» jl‏ )2012(- 

الاعتقاد بأن القياس نظام توجيه لا نظام تصويت: غالبًا ما تستخدم القياسات للعقاب 
أو المكافآت؛ ولا ينبغي أن تكون كذلكء بل يجب أن يكونوا على معرفة بالأدوات وا ممارسات 
الأكثر فاعليةء وما يجب إيقافه لأنه لا يعملء وما يجب فعله أكثر لأنه يعمل بشكل جيد. 
ونظام التحليلات الجيد ينبغي أن يخبرك أين تحتاج إلى التركيز. وربما يكون كل هذا التركيز على 
Facebook‏ غير مهم لأن ذلك ليس مكان جمهورك. حيث إنه من الممكن أن يكونوا جميعهم 
على تويتر أو العكس. «Chavess Paine J sgg‏ فإن تفضيل القناة لن يكون بالضرورة بديهيًاء 
يقول كل منهم: ”لقد عملنا للتو مع فندق م يكن لديه أي نشاط تقريبًا على Ass Twitter‏ 
تجارية واحدة غير أن لديه الكثير من أنشطة 1٤١١‏ لإحدى علاماتهم التجارية العالية“ وبدون 
أداة قياس دقيقةء فإنك لن تعرف. 

تتبع الشعور: يريد العملاء أن يأخذوا ما يسمعونه ويتعلمونه من المحادثات عبر الإنترنت 
ويعملون عليه. والمفتاح لذلك هو أن تكون دقيقًا في استخراج وتمييز نواياهم من خلال قياس 
مشاعرهم. وكما رأينا سابقًا في هذا الفصلء فإن الأدوات التحليلية النصية يمكنها تصنيف المحتوى 
عبر الإنترنت» وكشف المفاهيم ال مرتبطةء وكش ف الشعور في محادثة ك ”إيجابي". ”سلبي"» أو 
”محايد"» استنادًا إلى الكلمات التي يستخدمها الناس. ومن الناحية المثاليةء فإنك سوف ترغب في 
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أن تكون قادرًا على تمييز المشاعر تجاه منتج معينء وخدمة معينةء ووحدة أعمال محددة. وكلما 
زادت دقة فهمك للهجة والإدراك الذي يعبر عنه الناس, أصبحت المعلومات أكثر قابلية للتنفيذ, 
لأنك تخفف من المخاوف بش أن التناقض المختلط. ولا يجب وضع علامة ”محايدة“ على العبارة 
ذات التناقض المختلط. مثل: ”فندق في موقع رائع ولكن الحمام ذو رائحة كريهة“ لأن لديك 
إيجابيات وسلبيات تقابل بعضها البعض. ولكي تكون قابلة للتطبيق» فإنه يجب التعامل مع هذه 
الأنواع من العبارات بشكل منفصل. فمثلاء عندما نقول: ”كان الحمام كريه الرائحة“ هو شيء 
يمكن لأي شخص أن يلمسه بنفسه ويحسن حالته. كما يمكن تقسيم هذه المشاعر وتصنيفهاء 
وإلقاء نظرة على الاتجاهات رور الوقت» ورؤية اختلافات كبيرة في الطريقة التي يتحدث بها 
الناس بشكل إيجابي أو سلبي عنك» فضلًا عن مقارنة ا مشاعر حول علامتك التجارية مع منافسيك. 

تحسين دقة النص بشكل مستمر: إن استخدام حزمة تحليل نصوص خاصة بمجال الصناعة سوف 
يؤدي إلى معرفة مفردات عملك بالفعل. وسيكون للنظام قواعد لغوية مبنية فيه, لكنه يتعلم مع مرور 
الوقت ويصبح أفضل وأفضل. وبقدر تمكنك من ضبط نموذج dar]‏ بقدر حصولك على المزيد من 
البيانات» أو معلمات شبكة أفضلء أو تقنيات جديدة لتقديم نتائج أفضلء فإنك ستفعل الشيء نفسه 
مع معالجة اللغات الطبيعية التي تدخل في تحليل المشاعر. فإذا قمت بإعداد القواعد. والتصنيفات» 
بالإضافة إلى التنظيم» ومعانى الكلمات» شاهد كيف تبدو النتائج ثم عُدْ وكررها مرة أخرى. 


النظر إلى تأثير تأرجح النتائج: يسعى الجميع للوصول إلى نتيجة رائعة على موقع رفيع «Sal‏ 
ولكن هذا ليس كل شيء فهناك فرق بين النتيجة الرائعة التي تظهر وتختفي في مقابل نتيجة رائعة يتم 
التغريد بهاء وإعادة التغريد. والتقاطها من قبل المدونين المؤثرين. ويجب أن توضح لك التحليلات أي 
من الأنشطة المتعلقة بوسائل التواصل الاجتماعي تتحول إلى ”فيروسية“ وأي منها يسكن سريعًاء ولماذا. 

النظر إلى ما وراء العلامة التجارية: إن اهتمام الأشخاص بعلامتهم التجارية فقط يعد من أكبر الأخطاء 
التي يرتكبونها. وللنجاح في تحليل واستخدام وسائل التواصل الاجتماعي» فيجب عليك تفهم كل ما يثار 
من القضايا المحيطة بمنتجك أو خدمتك. وعادةً لا يهتم العملاء برسالة الشركة أو علامتها التجارية؛ فهم 
يهتمون بأنفسهم. لذلك؛ فإنه يجب الانتباه إلى ما يتحدثون عنهء وأين يتحدثون بذلك ومع من. 

التعرف على معظم التأثيرات القوية: تعاني المؤسسات من صعوبة تحديد صاحب التأثير الأكبر 
على الرأي العام» وهذا يبين أن أهم المؤثرين ليسوا بالضرورة ممن يؤيدون علامتك التجارية على وجه 
التحديد؛ ولكنهم يكونون ضمن من يؤثرون على نطاق المحادثة الدائرة حول موضوعكء وينبغي تفهم 
ما إذا كانوا يعطون آراءً إيجابية» أو يعبرون عن دعمهم» أو ببساطة يقدمون ملاحظات أو نقد. وذلك 
من خلال فهم طبيعة محادثاتهم» ومكان علامتي التجارية فيما يتعلق با منافسة في تلك المنطقة. 
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النظرة الثاقبة إلى دقة أدواتك التحليلية: حتى وقت قريب ل تكن الأدوات الآلية ا لمعتمدة 
على الحاسب تتسم بدرجة الدقة التي يتمتع بها البشر في غربلة محتوى الإنترنت. وحتى الآن 
تختلف الدقة باختلاف الوسائل. فبالنسبة مواقع مراجعة المنتجات ومواقع مراجعة الفنادق 
وتويترء يمكن أن تصل إلى دقة تتراوح بين 8١‏ و٠1‏ وذلك نظرًا لأن السياق يكون محاصرًا بشكل 
أكبر. وعندما تبدأ بالنظر إلى المدونات ومنتديات المناقشة. حيث تكون المحادثة واسعة النطاقء 
يمكن للبرنامج أن يحقق دقة تصل إلى 7١‏ (2012 ,02565 8 عمنهة). وستزداد هذه الأرقام 
بمرور الوقت لأن أدوات التحليلات يتم ترقيتها باستمرار بقواعد جديدة وخوارزميات محسنة 
لتعكس التجربة الميدانية والمنتجات الجديدة وتغير ظروف السوق وأنماط الكلام الناشئة. 

دمج ذكاء وسائل التواصل الاجتماعي في التخطيط: هجرد أن يكون لديك منظور كبير للصورة 
مع نظرة تفصيلية» يكون بإمكانك البدء في دمج هذه المعلومات في دورة التخطيط الخاصة بك. 
غير أن هذا كلام يصعب تنفيذه. وقد كشف استطلاع سريع للجمهور أن قليل من الناس الآن 
يقومون بدمج التعلم من المحادثات عبر الإنترنت في دورات التخطيط الخاصة بهم )& Paine‏ 
(Chaves, 2012‏ وتعد إحدى طرق تحقيق ذلك هي إيجاد علاقات زمنية بين مقاييس وسائل 
التواصل الاجتماعي وأنشطة الأعمال الأخرى أو أحداث السوق. وعادةً ما يتم اللجوء إلى وسائل 
التواصل الاجتماعي إما بشكل أساسي أو بواسطة شيء تقوم به مؤسستك. وبالتاليء إذا لاحظت 
تصاعدًا في النشاط في أي نقطة من الزمن» فتكون بحاجة لمعرفة أسباب ذلك. 


أسئلة مراجعة على القسم :٠١-0‏ 

-١‏ ما المقصود بالتحليلات الاجتماعية؟ وطاذا تعتبر مهمة؟ 

lo -Y‏ هي الشبكة الاجتماعية؟ وما هي الحاجة لنظام الحسابات القومية؟ 

*- ما هي وسائل التواصل الاجتماعي؟ وكيف ترتبط ب 2.0 $Web‏ 

ع- ما هي تحليلات وسائل التواصل الاجتماعي؟ وما هي أسباب تزايد انتشارها؟ 
5- كيف يمكنك قياس تأثير تحليلات وسائل التواصل الاجتماعي؟ 


تلخيص لأهم نقاط الفصل: 

- التنقيب في النص هو اكتشاف المعرفة من مصادر البيانات غير المهيكلة (غاليًا تستند إلى النص). 
وحيث إن قدرًا ge BaS‏ المعلومات يكون في شكل 9B «a‏ التنقيب في النص هو واحد من 
أسرع فروع مجال ذكاء الأعمال نموًا. 
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- تتواجد تطبيقات التنقيب في النص في كل مجال من مجالات العمل والحكومة تقريبًاء بما في ذلك 
التسويق والتمويل والرعاية الصحية والطب والأمن الداخلي. 1 

- يقوم التنقيب في النص باس تخدام معالجة اللغة الطبيعية )N1۳(‏ للحث على هيكلة مجموعة 
النصوصء ثم يستخدم بعد ذلك خوارزميات التنقيب في البيانات مثل التصنيف والتجميع 
والاقتران وتسلسل الاكتشاف لاستخراج المعرفة منها. 

- يمكن تعريف الشعور بأنه رأي ثابت يعكس مشاعر المرء. 

- يتعامل تحليل المشاعر مع التمييز بين فئتين؛ إيجابية وسلبية. 

- كمجال للبحث» برتبط تحليل المشاعر ارتباطًا وثيقًا بعلم لغات الحاسوب والبرمجة اللغوية 
العصبية, والتنقيب في النصوص. 

- يحاول تحليل المشاعر الإجابة عن السؤال التالي: ”بم يشعر الناس حول موضوع معين؟“ عن 
طريق التعمق في آراء الكثيرين باستخدام مجموعة متنوعة من الأدوات الآلية. 

- يعتبر صوت العميل (©0) جزءًا لا يتجزأ من نظامّي إدارة علاقات العملاء التحليلية وإدارة 
تجارب العملاء. وغالبًا ما يتم تشغيلها من خلال تحليل المشاعر. 

- يدور صوت السوق sl eò Jaa (VOM)‏ والاتجاهات الكلية على مستوى السوق. 

- يتم تحقيق تحديد التناقض في تحليل المشاعر إما باستخدام المعجم كمكتبة مرجعية أو باستخدام 
مجموعة من وثائق التدريب. 

- 11014061 هو معجم شهير للأغراض العامة تم إنشاؤه في جامعة برينستون. 

SentiWordNet -‏ هو امتداد ل 18002161 لكي يُستخدم لتعريف المشاعر. 

- تحليلات الكلام هي مجال متزايد من العلوم يسمح للمستخدمين بتحليل واستخراج المعلومات 
من المحادثات الحيّة والمُسجلة. 

- يمكن تعريف التنقيب في الويب بأنه اكتشاف وتحليل معلومات مثيرة للاهتمام ومفيدة من 
الويب» وعن الويب» وعادةً ما تستخدم أدوات تستند إلى الويب. 

- يمكن النظر إلى التنقيب على الويب على أنه يتكون من ثلاثة مجالات هي: التنقيب في محتوى 
الويب» والتنقيب في هيكل الويبء والتنقيب في استخدام الويب. l ٠‏ 

- يشير التنقيب في محتوى الويب إلى الاستخراج التلقائي للمعلومات المفيدة من صفحات الويب» 
ويمكن استخدامه لتحسين نتائج البحث التي تنتجها محركات البحث. 
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- يشير التنقيب في هيكل الويب إلى توليد معلومات مثيرة للاهتمام من الروابط الموجودة ضمن 


- يمكن استخدام التنقيب في هيكل الويب أيقََا لتحديد أعضاء مجتمع معينء وربما أيًا لأدوار 
الأعضاء في ا مجتمع. 


- يشير تعدين استخدام الويب إلى تطوير معلومات مفيدة من خلال تحليل سجلات خادم الويب» 
وملفات تعريف المستخدمينء» ومعلومات المعاملات. 

- ظهر كل من التنقيب في النصوص والتنقيب في الويب كمكونات حيوية للجيل القادم من أدوات 
ذكاء الأعمال لتمكين المنظمات من التنافس بنجاح. 

- محرك البحث هو برنامج يقوم بالبحث عن الوثائق (مواقع الإنترنت أو الملفات). استنادًا إلى 
الكلمات المفتاحية (كلمات فردية:» أو مصطلحات متعددة الكلمات. أو جملة كاملة) التي 
يقدمها المستخدمونء والتي تتعلق بموضوع استعلاماتهم. 

- 55:0 هو النشاط ا معني بالتأثير على رؤية أي موقع تجارة إلكترونية أو أي موقع ويب في نتائج 
البحث الطبيعية ملحرك البحث (غير المدفوع أو الأساسي). 

VOC -‏ هو مصطلح يستخدم عادةً لوصف العملية التحليلية لالتقاط توقعات العميل وتفضيلاته 


وعدم تفضيلاته. 
- التحليلات الاجتماعية هي مراقبة وتحليل وتفسير التفاعلات الرقمية وعلاقات الأشخاص 
والمواضيع والأفكار واملحتوى. 


- الشبكة الاجتماعية هي بنية اجتماعية تتألف من أفراد / أشخاص (أو مجموعات من الأفراد أو 
المنظمات) ترتبط فيما بينها بنوع من الروابط / العلاقات. 

- تشير تحليلات وسائل التواصل الاجتماعي إلى الطرق المنهجية والعلمية لاستهلاك الكمية الهائلة 
من المحتوى الذي تم إنشاؤه بواسطة منافذ وأدوات وتقنيات وسائل التواصل الاجتماعي على 
الويب من أجل تحسين القدرة التنافسية للمنظمات. 








مصطلحات أساسية: 
اقتران. معالجة اللغة الطبيعية تحليلات وسائل التواصل البيانات غير 
(NLP)‏ الاجتماعي. المهيكلة. 
صفحات | وضع علامات على جزء من شبكة اجتماعية. صوت العميل 
موثوقة. الكلام. (VOC)‏ 
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تصنيف. تحديد التناقض. عنكبوت. تحليلات الويب. 
تحليل النقر. -Polyseme‏ الانبثاق. التنقيب في محتوى 
الويب 
محرك البحث. كلمات التوقف. زاحف الويب. 





التنقيب في الويب. 


فوفة 
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تحليل المشاعر. 
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التنقيب باستخدام 
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التنقيب في النص. 


"Tokenizing 
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-WordNet 








تحليل النزعة. 








البحث عن 
موضوع ناجم 
رابط تشعبي 

(HITS) 








أسئلة للمناقشة: 

-١‏ اشرح العلاقة بين التنقيب في البيانات» والتنقيب في النصء وتحليل المشاعر. 

۲- عرف - بأسلوبك الخاص - التنقيب في النص» وناقش تطبيقاته الأكثر شيوعًا. 

- ماذا يعني الحث على هيكلة البيانات النصية؟ ناقش الطرق البديلة لهيكلة البيانات النصية. 

-٤‏ ما هو دور N1۴‏ في التنقيب في النص؟ ناقش قدرات وقيود N1۴‏ في سياق التنقيب في النص. 

-٥‏ اسرد وناقش ثلاثة مجالات تطبيق بارزة للتنقيب في النص. ما هي الفكرة الرئيسة الشائعة بين 
مجالات التطبيق الثلاثة التي اخترتها؟ 

1- ما هو تحليل المشاعر؟ وكيف يرتبط بالتنقيب في النص؟ 


۷ ما هي التحديات الشائعة التي يتعين على تحليل المشاعر التعامل معها؟ 


۸- ما هي مجالات التطبيق الأكثر شيوعًا لتحليل المشاعر؟ وماذا؟ 
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٩‏ ما هي الخطوات الرئيسة في تنفيذ مشروعات تحليل المشاعر؟ 

-٠١‏ ما هما الطريقتان الشائعتان لتحديد التناقض؟ اشرح إجابتك. 

-١‏ ناقش أوجه الاختلاف والشبه بين التنقيب في النص والتنقيب في الويب. 

-١١‏ بأسلوبك الخاص عرّف التنقيب في الويب» مع مناقشة أهميته. 

-١‏ ما هي المجالات الرئيسة الثلاثة للتنقيب في الويب؟ ناقش أوجه الاختلاف والشبه بين هذه 
المجالات الثلاثة. 

-١5‏ ما هو محرك البحث؟ ولاذا يعتبر مهما للشركات؟ 

TSEO 5a la -10‏ ومن الذي يستفيد منه؟ وكيف؟ 

7- ما هي تحليلات الويب؟ وما هي المقاييس المستخدمة فيها؟ 

۷- عرف كلا من التحليلات الاجتماعية والشبكة الاجتماعية وتحليلات الشبكة الاجتماعية. وما 
هي العلاقات فيما بينها؟ 

۸- ما هي تحليلات وسائل التواصل الاجتماعي؟ وكيف تتم؟ ومن الذي يقوم بها؟ وماذا يخرج منها؟ 


تمارين - شبكة جامعة تيراداتا (11020) وغيرها من التمارين اليدوية: 

-١‏ قم بزيارة درمء.0:1اع62012]21219615116702]. حدد الحالات عن التنقيب في النص. قم 
بوصف التطورات الأخيرة في هذا المجال. إذا لم تستطع إيجاد حالات كافية على موقع شبكة 
جامعة تيراداتا على الوبب» قم بتوسيع بحثك إلى موارد أخرى تستند إلى الويب. 

algai sbandl ShI) G sav gf teradatauniversitynetwork.com J| Jäs! -Y‏ على 
الويب واللواد الأخرى المتعلقة بالتنقيب في النصوص. قم بتجميع النتائج الخاصة بك في 
تقرير قصير مكتوب. 

؟- اذهب teradatauniversitynetwork.com J}‏ وقم بإيجاد دراسة الحالة التي تحمل اسم 
.“eBay Analytics”‏ اقرأً الحالة بعنايةء وافهمها جيدًا من خلال البحث في الإنترنت للحصول 
على معلومات إضافيةء والإجابة عن أسئلة الحالة. 

teradatauniversitynetwork.com J| Jäs) -£‏ وإبحث عن حالة تحليل المشاعر التى تحمل 

اسم "How Do We Fix an App Like That?"‏ !1,8 الوصف» واتبع الإرشادات لتنزيل 
بيانات وأداة تنفيذ التمرين. 
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e ON bJI sa». -teradatauniversitynetwork.com 8); e. 3 -o‏ التنقيب في الويب. قم 
بوصف التطورات الأخيرة في هذا المجال. إذا للم تستطع إيجاد حالات كافية على موقع شبكة 
جامعة تيراداتا على الويب» قم بتوسيع بحثك إلى موارد أخرى تستند إلى الويب. 

-١‏ تصفح الويب وقواعد البيانات الرقمية الخاصة بمكتبتك لتحديد المقالات التي تصنع الرابط بين 
التنقيب في النصوص / الويب والأنظمة المعاصرة لذكاء الأعمال. 


مشروعات مهام الفريق ولعب الأدوار: 

-١‏ افحص كيقية التقاط البيانات النصية تلقائيًا باستخدام تقنيات الويب. وفور التقاطهاء ما هي 
الأنماط المحتملة التي يمكنك استخراجها من هذه المصادر غير المهيكلة للبيانات؟ 

-Y‏ قم بمقابلة المسؤولين في كليتك أو المسؤولين التنفيذيين في مؤسستك لتحديد كيف يمكن أن 
يساعدهم التنقيب في النصوص والتنقيب في الويب في عملهم. اكتب اقتراحًا يصف نتائجك» 
ثم أعدَّ تقريرًا يتضمن تقديرات التكلفة والفوائد. 

"- انتقل إلى موارد مكتبتك على الإنترنت. تعلم كيفية تنزيل سمات مجموعة من الأدبيات 
(مقالات الدوريات) في موضوع محدد. ثم قم بتنزيل البيانات ومعالجتها باستخدام منهجية 
مشابهة لتلك التي تم شرحها في الحالة العملية .)0-٥(‏ 

€- ابحث عن مجموعة بيانات نص المشاعر اللتاحة بسهولة (انظر الرؤية الفنية (0-؟)للحصول على 
قائمة بمجموعات البيانات الشائعة) وقم بتنزيلها إلى جهاز الحاسب الخاص بك. إن كان لديك 
أداة تحليلية قادرة على التنقيب في النصوص, فاس تخدمها. وإن لم يكن قم بتنزيل وتثبيت 
.RapidMiner (http://rapid-i.com)‏ قم أيضًا بتثبيت الوظيفة الإضافية Text Analytics‏ 
لبرنامج .۸4p1 M1۴۲‏ قم عالجة البيانات التي تم تنزيلها باستخدام أداة التنقيب في النص 
(أي تحويل البيانات إلى نموذج منظم)» ثم قم ببناء النماذج وتقييم دقة الكشف عن المشاعر 
في العديد من نماذج التصنيف (مثل: آلة المتجهات الداعمة. أشجار القرارء الشبكات العصبية, 
الانحدار اللوجستي). اكتب تقريرًا تفصيليًا تشرح فيه نتائجك وخبراتك. 

-٥‏ افحص كيفية التقاط البيانات المستندة إلى الويب تلقائيًا باستخدام أحدث التقنيات. وفور 

التقاطهاء ما هي الأنماط المحتملة التي يمكنك استخراجها من هذه المصادر الغنية بالمحتوى 
للبيانات» والتي تكون في معظمها غير منظمة؟ 
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تمارين الإنترنت: 

-١‏ قم بإيجاد حالات حديثة لتطبيقات ناجحة عن التنقيب في النصوص والتنقيب في الويب. 
جرب موردي وشركات الاستشارات لبرامج التنقيب في النصوص والويب وابحث عن حالات أو 
قصص نجاح» ثم قم بإعداد تقرير يلخص خمس دراسات حالة جديدة. 

۲- انتقل إلى Downloads zèl .statsoft.com‏ وقم بتنزيل ثلاث صفحات بيضاء على الأقل 
حول التطبيقات. أي من هذه التطبيقات استخدم تقنيات التنقيب في البيانات / النص / 
الويب التي تمت مناقشتها في هذا الفصل؟ 

«as.com |J]  àl -Y‏ $9 بتنزيل ثلاث صفحات بيضاء على الأقل حول التطبيقات. أي من 
هذه التطبيقات استخدم تقنيات التنقيب في البيانات / النص / الويب التي تمت مناقشنها 
في هذا الفصل؟ 

dbm.com JJ J A3 -€‏ وقم بتنزيل ثلاث صفحات بيضاء على الأقل حول التطبيقات. أي من 
هذه التطبيقات استخدم تقنيات التنقيب في البيانات / النص / الويب التي تمت مناقشتها 
في هذا الفصل؟ 

ه- انتقل إلى 0ه620213.0: وقم بتنزيل ثلاث صفحات بيضاء على الأقل حول التطبيقات. أي 
من هذه التطبيقات استخدم تقنيات التنقيب في البيانات / النص / الويب التي تمت مناقشتها 
في هذا الفصل؟ 

-٦‏ انتقل إلى Ja 5» e35 «larabridge.com‏ ثلاث صفحات بيضاء على الأقل حول التطبيقات. 
أي من هذه التطبيقات استخدم تقنيات التنقيب في النص بطريقة مبتكرة؟ 

۷- انتقل إلى تدمه.5]عع1»051188 قم باستكشاف الأقسام حول التطبيقات وكذلك البرامج. قم 
بإيجاد أسماء ثلاث حزم إضافية على الأقل للتنقيب في البيانات والتنقيب في النصوص. 

8- قم بمسح بعض أدوات وموردي التنقيب في الويب. حدد بعض منتجات التنقيب في الويب 
ومقدمي الخدمات غير المذكورة في هذا الفصل. 

attensity.com |J] JJ à3l -3‏ 635 بتنزيل ثلاث صفحات بيضاء على الأقل حول التطبيقات. أي 
من هذه التطبيقات استخدم تقنيات التنقيب في البيانات / النص / الويب التي تمت مناقشتها 
في هذا الفصل؟ 
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التحليلات التوجيهية: التحسين والمحاكاة 


أهداف التعلم: 
- فهم تطبيقات تقنيات التحليلات التوجيهية بالاشتراك مع إعداد التقارير والتحليلات التنبؤية. 
- استيعاب المفاهيم الأساسية لنمذجة القرارات التحليلية. 
- استيعاب مفاهيم النماذج التحليلية لمشاكل القرار ا مختارة بما في ذلك البرمجة الخطية ونماذج 
المحاكاة لدعم القرار. 
- وصف كيفية استخدام جداول البيانات بالنسبة لكل من النمذجة التحليلية والحلول التحليلية. 
- شرح المفاهيم الأساسية للتحسين وتوقيت استخدامها. 
- وصف كيفية هيكلة موذج برمجة خطية. 
- شرح المقصود بتحليل الحساسيةء وتحليل «ماذا - ag)‏ والبحث عن الهدف. 
- استيعاب مفاهيم وتطبيقات أنواع المحاكاة المختلفة. 
- فهم التطبيقات المحتملة لممحاكاة الأحداث المنفصلة. 
يعد هذا الفصل إضافة جديدة إلى هذا الكتاب» حيث يتخطى مرحلة تطبيقات التحليلات وصولا 
إلى ما بعد إعداد التقارير والتحليلات التنبؤية. ويغطى هذا الفصل التقنيات ال مختارة التي هكن 
توظيفها جنبًا إلى جنب مع النماذج التنبؤية للمساعدة في دعم الق رار. ونركز هنا على التقنيات 
التي يسهل تنفيذها نسبيًا سواء باستخدام أدوات جداول البيانات أو باستخدام أدوات برمجية قائمة 
بذاتها. وبالطبع» يوجد الكثير من التفاصيل الإضافية ليت م تعلمها حول ماذج علوم الإدارةء ولكن 
الهدف من هذا الفصل هو فقط توضيح ما هو ممكن وكيفية تنفيذه ضمن إعدادات حقيقية. 
ونعرض فيما يلي تقديًا لهذه ال مادة مع ملاحظة الحذر: قد تشكل النمذجة موضوعًا صعيًاء 
كما تعد فنا بجانب كونها علمًا. وليس بالضرورة أن تكون الغاية من هذا الفصل أن تصبح خبيا 
بالموضوعات التي تتعلق بالنمذجة والتحليل» ولكن تُستخدّم المادة لاكتساب المعرفة بالمفاهيم 
المهمة من حيث صلتها بالتحليلات التوجيهية واستخدامها في صنع القرار. ومن امهم أن ندرك أن 
النمذجة التي نحن بصدد الحديث عنها هنا ترتبط فقط بشكل سريع بممفاهيم نمذجة البيانات. 
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فيجب عدم الخلط بينهما. إننا نتحرك عبر بعض اطفاهيم والتعاريف الرئيسة لنمذجة القرارء ونقدم 
بعد ذلك فكرة النمذجة بشكل مباشر في جداول البيانات. ثم بعد ذلك نناقش الهيكل والتطبيق 
لنماذج ومنهجيات برهنت على نجاحها عبر الزمن: البرمجة الخطية ومحاكاة الحدث المنفصل. 
وكما ذُكِرَ سابقّه من الممكن الحصول على دورات متعددة - تحديدًا - في هذين الموضوعينء ولكن 
هدفنا هو منحك إحساس بما هو ممكنء وذلك من خلال الأقسام المتنوعة لهذا الفصل. 


1-1 مقال افتتاحي: منطقة فيلاديلفيا التعليمية تستخدم التحليلات التوجيهية 
لإيجاد حلٍ أمثل لإبرام عقود خطوط سير الحافلات: 
خلفية: 


يعد اختيار أفضل الموردين للعمل مهمة مرهقة بل وذات أهمية كبيرة للشركات والمنظمات 
الحكومية. فبعد تقديم كل مورد لعطائه بخصوص مهمة معينة من خلال عملية المناقصة تقوم 
الشركة أو المنظمة بتقييم كل اقتراح ومن ثم اتخاذ قرار بشأن اختيار المورد الأنسب لاحتياجاتهم. 
aL es‏ تضطر الحكومات لاستخدام عملية تقديم العطاءات للمفاضلة بين الموردين ومن ثم 
الاختيار من بينهم. كانت منطقة فيلاديلفيا التعليمية تسعى للاستعانة بمصادر خارجية لبعض 
خطوط الحافلات الخاصة بهم؛ إذ لا تمتلك المقاطعة إلا عددًا قليلًا من حافلات المدارس, لا يكفي 
لخدمة الطلاب القاطنين بهاء فكانوا يخدمون بحافلاتهم الخاصة من <۲١‏ إلى ٤١‏ فقط من 
الطرق فقرروا الاستعانة بموردي خدمة الحافلات الخاصة كمصدر خارجي لتغطية بقية الطرق. 
تم تكليف تشارلز لويتز (1.01112 0131165). «JE cS UI utl‏ بتحديد كيفية تعظيم 
العائد على الاستثمار وتحسين طريقة إبرام العقود مع مختلف الموردين. 

في الماضيء كانت عملية اختيار موردي خدمة الحافلات الذين يتم التعاقد معهم وفقًا للقيود 
المالية والزمنية عملية مرهقة إذ كانت تتم يدويًا. بالإضافة إلى ذلك كانت المتغيرات والعوامل 
المختلفة التي يجب مراعاتها تزيد الأمر تعقيدًا. فقد كانت عملية تقييم الموردين لهذه الخدمة 
تتم بناءً على خمسة متغيرات وهي: التكلفةء والقدرات, والأمانة والاستقرار اطالي» والفراسة. 
قام كل مورد بتقديم عطاءه بسعر مختلف للطرق المختلفة. وضع بعض الموردين حدًا أدنى 
ilo $g gudl bohó sus)‏ عدم مقابلة هذا العدد للمطلوبء فستزيد التكلفة. وكان Lowitz‏ 
بحاجة لمعرفة كيفية دمج المعلومات لكل عطاء تم تقديمه. وذلك لتوزيع خطوط السير على 
الموردين بحيث تتم تغطية كل الطرق بأقل تكلفة. 
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الحل: 

بحث 10۷112 في البداية عن برنامج يستطيع استخدامه جنبًا إلى جنب مع نموذج العقد 
الخاص به على ia Excel‏ باستخدام برنامج 5019762 «تناتدمء:2 «, 5,5 4 Frontline‏ 
5 مما مكنه من تحديد أفضل الموردين ماليًا وتشغيليًاء وقام بإنشاء نموذج أمثل يأخذ 
في الحسبان المتغيرات الخمسة سالفة الذكر المتعلقة بكل مورد. وقد تضمن النموذج متغيرات 
ثنائية صحيحة (نعم / لا) لكل خط من خطوط السير ليتم منحها للموردين الذين تقدموا لتغطية 
خط سير معين بتكلفة معينة. وقد بلغت هذه المتغيرات ذات (نعم / لا) ما يقرب من 17٠١‏ 
متغير. كما تضمن النموذج أيضًا قيودًا تشير إلى أنه سيتم تخصيص مورد واحد فقط لكل خط 
سير وبالطبع لا بد من تغطية كل خطوط السير. وتم وضع حد أدنى لعدد خطوط السير التي 
يخدمها أي موردء كما تم وضع قيود لبعض التفاصيل الأخرى. ويمكن كتابة كل هذه القيود 
كمعادلات وإدخالها في نموذج برمجة خطية تامة. وتجدر الإشارة إلى أن هناك العديد من أدوات 
البرامج تستطيع صياغة مثل هذه النماذج وحلهاء غير أن esè Jex Microsoft Excel alaanu‏ 
النموذج أمرًا أكثر سهولة. فتم تضمين برنامج 501762 الخاص بشركة 5دص6]ةتز5 ومناغصم8 داخل 
أدوات ٤×٤1‏ :210501 للقيام بحل المشاكل الصغيرة مجانًا. أما النماذج الأكبر حجمًا والأكثر 
تعقيدًا فيمكن حلها عن طريق شراء إصدار أكبر. وهذا ما فعله .Lowitz‏ 


الفوائد: 

ساعد النموذج في تطوير حجم كل عقد من العقود, فضلًا عن تحديد عدد الموردين الواجب 
التعاقد معهم. حيث يتفاوت حجم العقود من مورد لآخر وذلك ما بین ٩۷-٤‏ خط سر للمورد 
الواحد. وفي النهايةء تمكنت منطقة فيلاديلفيا التعليمية من وضع خطة تحتوي على العدد الأمثل 
لشركات توريد الحافلات باستخدام برنامج 8:061 بدلًا من العملية اليدوية. وهكذا تمكنت 
المقاطعة من توفير الوقت وامال وذلك باستخدام الأدوات Premium Solver gaby) äh‏ 
لإنشاء نموذج أمثل بالمتغيرات المختلفة. 


ماذا يمكننا أن نتعلم من هذه المقالة القصيرة: 
تواجه معظم المنظمات مشكلة صنع القرارات حين يلزم اختيار واحد من عدة خيارات. إذ 


يكون لكل خيار تكلفة وإمكانية يرتبطان به. وتهدف مثل هذه النماذج إلى اختيار توليفة من 
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التحليلات التوجيهية بشكل خاص على مثل هذه المشكلة المتعلقة بالقرارات. ووجود أدوات مثل 
Jo» ell! Premium Solver‏ 8061 يجعل من السهولة بمكان تطبيق مثل هذه التقنيات. 


أسئلة مراجعة على المقالة الافتتاحية: 
-١‏ ما هو القرار المتخذ في هذه اطقالة الإفتتاحية؟ 
۲- ما هي البيانات (الوصفية أو التنبؤية) التي قد يتم الاحتياج إليها لعمل أفضل التوزيعات في هذا السيناريو؟ 
٣‏ ماهي التكاليف أو القيود الأخرى الواجب مراعاتها عند إبرام مثل هذه العقود المتعلقة بخطوط السير؟ 
ع- ما هي المواقف الأخرى التي يمكن تطبيق مثل هذه النماذج عليها؟ 
۲-١‏ اتخاذ القرار بناءً على النموذج: 

إن اتخاذ القرارات باستخدام أحد أنواع النموذج التحليلي هو ما نسميه التحليلات التوجيهية, 
وذلك كما تبين من المقالة القصيرة السابقة. وقد تعلمنا في العديد من الفصول السابقة قيمة 
وعملية معرفة تاريخ ما يجري واستخدام هذه المعلومات أيضًا من أجل التنبؤ بالأمور المرجح 
حدوثها. وعلى أية حال فإننا سنحاول من خلال هذا التمرين تحديد ما ينبغي عمله فيما هو 
آتِ. وقد يترتب على ذلك تحديد العملاء المُرجح قيامهم بالشراء منا وتقديم عرض أو إعطاء 
سعر يزيد من احتمالية قيامهم بالشراء وبالتالي فإن ذلك سيؤدي إلى تعظيم الأرباح إلى الحد 
الأمشل. وعلى العكس من ذلكء فقد ينطوي الأمر على القدرة على التنبؤ بالعميل الذي يحتمل 
اتجاهه إلى مكان آخر والقيام بتقديم عرض مُغري له للاحتفاظ به كأحد العملاء ورفع قيمتنا 
لديه. وللتأكد من تغطية جميع احتياجاتنا وتقليل التكلفة إلى أدنى حد ممكن فإننا قد نحتاج إلى 
اتخاذ بعض القرارات بخصوص منح العقود للموردين. ومن الممكن أن نواجه وضعًا ما يتطلب 
تحديد أي العملاء المحتملين ينبغي حصوله على مواد الحملة الترويجية بحيث لا تكون تكاليف 
الترويج التي نتحملها باهظة» ونقوم بزيادة معدل الاستجابة إلى أقصى حد ممكن با لا يتعدى 
حدود الميزانية. وقد نتخذ قرارًا بشأن ما يجب دفعه مقابل كلمات البحث الرئيسة غير الجانية 
لرفع عائد الاستثمار لميزانية الإعلانات الخاصة بنا إلى أقصى حد ممكن. وعلى صعيد آخرء فإننا قد 
نضطر إلى دراسة تاريخ أنماط وصول عملائنا واستخدام تلك المعلومات من أجل التنبق بمعدلات 
الوصول المستقبليةء وتطبيق ذلك لجدولة عدد مناسب من موظفي المتجر لرفع استجابات العملاء 
إلى أقصى حد بالإضافة إلى تحسين تكاليف العمالة لدينا. ويمكننا من خلال الاعتماد على تحليلاتنا 


Source: Adapted with permission from "Optimizing Vendor Contract Awards Gets an A+,” http:// www. 
solver.com/news/optimizing-vendor-contract-awards-gets, 2016 (accessed July 2016). 
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وتوقعاتنا للطلب على منتجاتنا وتكاليف سلس لة التوريد. اتخاذ قرارات بشأن المواقع التي سنقوم 
فيها بإنشاء مستودعاتنا. بالإضافة إلى أن المعلومات الخاصة بأحجام المنتجات التي سيتم تسليمها 
في مواقع مختلفة وتكاليف التسليم وتوافر سيارة للنقل تسمح لنا بتحديد طرق التسليم اليومية. 
ويستطيع الشخص الحصول على مئات الأمثلة الخاصة بالحالات التي تكون فيها القرارات المستندة 
إلى البيانات ذات قيمة. وفي الواقع» فإن القدرة على استخدام رؤى وصفية وتنبؤية لمساعدة 
صانع القرار على اتخاذ قرارات أفضل تعد أكبر فرصة متاحة للهنة التحليلات المتنامية. وعلى 
الرغم من وجود حالات يتم اتخاذ القرارات فيها من خلال الاعتماد على الخبرة والحدسء غير 
أن الأرجح أن القرارات التي يدعمها نموذج ما ستساعد صانع القرار على اتخاذ قرارات أفضل. 
وبالإضافة إلى ذلك أيضًاء فإن هذه القرارات التي يدعمها نموذج ما ستوفر لصانعي القرار مبررات 
للتوصيات التي يقدمونها. وهكذا برزت التحليلات التوجيهية باعتبارها أقصى ما انتهى إليه العلم 
في مجال التحليلات ليتم تطبيقه لاحقًاء وهي تنطوي بشكل أساسي على استخدام نموذج تحليلي 
للمساعدة في توجيه صانع القرار في اتخاذ القرارء أو جعل عملية اتخاذ القرار عملية آلية وذلك 
حتى يتمكن النموذج من تقديم توصيات أو قرارات. ونظرًا لأن التحليلات التوجيهية تركز على 
تقديم التوصيات أو اتخاذ القرارات» فإن البعض يُسمي هذه الفئة من التحليلات بتحليلات القرار. 
وتتضمن جميع منشورات 1111013/5 مثل 10167125 و/1010417 010/15 ومجلة التحليلات 
Analytics‏ القصص التي توضح التطبيقات الناجحة لنماذج القرار في الإعدادات الحقيقية. 
ويشتمل هذا الفصل على العديد من الأمثلة على مثل هذه التطبيقات التحليلية الإرشادية. وتجدر 
بنا الإشارة إلى أن تطبيق نماذج لحالات واقعية يمكنها أن توفر ملايين الدولارات أو تدر عائدًا بملايين 
الدولارات. وقد وصف d e3ll od cU us (Y 3) 55,515 Christiansen 9 J$‏ عمليات 
شركة الشحن باستخدام :10118016016 بأنها نظام دعم القرار (1055) لتوجيه السفن والجدولة, 
وهم يدعون أن الشركة استخدمت هذا النموذج على مدى ثلاثة أسابيع لتحسين الاستفادة من 
أسطولهاء الأمر الذي أدى إلى تحقيق ربح إضافي يتراوح من مليون إلى مليوني دولار في مثل هذه 
الفترة الزمنية القصيرة. وفي الحالة العملية (V7‏ نقدم مثالًا آخر لتطبيق نموذج. 
حالة عملية ١-5‏ 
النقل الأمثل للبيانات من الخادم نهءع10015]1 تلشركة إكسون ExxonMobil Jugs‏ 
من خلال نظام دعم القرار 1255 
شركة إكسون موبيل هي شركة بترول وغاز طبيعيء وتعمل في العديد من البلدان 
في جميع أنحاء العام وتوفر الشركة ا منتجات البترولية ا مختلفة. ها ف ذلك الوقود 
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النظيف» ومواد التشحيم» واممنتجات ذإت القيمة العالية بالإضافة إلى المواد الخام 
للعديد من العملاء. ويتم استكمال ذلك من خلال سلسلة توريد معقدة بين مصافيها 
وعملائها. ويّعد زيت غاز التفريخ (1760) «مناناءه7 هو أحد المنتجات الرئيسة لشركة 
82003001 الناقلة 0:15م5ههء]. وتقوم شركة إكسون موبيل 11ا8:2028/10 بنقل 
العديد من السفن المحملة بشحنات 10805م51 زيت غاز التفريغ VGO‏ من أورويا إلى 
الولايات اممتحدة. وتش ير التقديرات إلى أن إكسون موبيل تقوم بنقل حوالي من ۷٠-٠١‏ 
سفينة محملة بزيت غاز التفريغ VGO‏ عبر المحيط الأطلسيء في العام الواحد. وقد كان 
من المقرر حتى الآن أن تتم عملية نقل زيت غاز التفريغ VGO‏ عبر المحيط الأطلسي 
من خلال عملية نقل يدوية مرهقة سواء تم هذا النقل من خلال السغن التي تديرها 
شركة إكسون موبيل أو سفن طرف ثالث 697:هم-150ط] على حد سواء. وتتطلب العملية 
برمتها تعاون العديد من الافراد عبر منظمة سلسلة التوريد. ولتحديد الجدول الزمني 
للنقل الخاص بالسفن فإنه يتم استخدام العديد من جداول البيانات المخصصة ذات 
القيود والمتطلبات الخاصة والمقايضات الاقتصادية. وقد شملت بعض القيود ما يلي: 

-١‏ تفاوت توقعات الإنتاج والطلب بصفة دائمة. 

۲- قيود الحد الأدنى والحد الأقصى من المخزون. 

-١‏ مجموعة من السفن ابمتنوعة (مثل: السفن ذات السرعات المتفاوتة وحجم البضائع). 

ع- السفن التي يتم تنزيلها وتفريغها في منافذ متعددة. 

0- كل من إكسون موبيل امُدارة ومستلزمات الطرف الثالث واممنافذ. 

1- تكلفة النقل المعقدة والتي تتضمن تغطية زيادة التكاليف وغرامات التأخير. 

/ا- حجم السفينة وحدود المسارات للموانئ المختلفة. 

ويتعذر على العملية اليدوية القيام بتحديد المسارات الفعلية للسفنء وتوقيت كل 
سفينةء وكمية زيت غاز التفريغ ۷60 المحملة أو المفرغة. وبالإضافة إلى ذلك. فإن 
بيانات الإنتاج والاستهلاك في عدة مواقع جعلت العملية اليدوية مرهقة وغير فعالة. 

المنهجية / الحل: 

وقد تم تطوير أداة دعم القرار التي تساعد المُجدولين على التخطيط لجدول زمني 
مثالي للسفن «Jas «Jod‏ وتفريغ زيت غاز التفريخ ۷60 من وإلى Bas‏ مواقع. وقد تم 
صياغة المشكلة كمشكلة البرمجة الخطية العددية. وقد كان من الضروري أن يلبي الحل 
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المتطلبات الخاصة بالتوجيه. والنقل» والجدولةء وإدارة المخزون إزاء تباينات الإنتاج والطلب 
المختلفة. وقد استُخدمّت لغة البرمجة الرياضية 64۷8S‏ لصياغة المشكلةء كما استخدم 
مایکروسوفت إکسل ٤×۵1‏ ا؟مءهءM‏ كواجهة امستخدم. وعندما يتم تشغيل آلة الحل 
ex «B (ILOG CPLEX)‏ التوصل إلى حل أمثل في نقطة تتوقف فيها القيمة الموضوعية 
للحل الحالي عن التحسن» حيث يتم تحديد معيار التوقف خلال كل برنامج تشغيل. 

النتائج / الفوائد: 

ومن المتوقع أن يؤدي استخدام نموذج التحسين إلى خفض تكاليف الشحن بالإضافة 
إلى خفض النفقات الخاصة بغرامات التأخير. ونظرًا لأن الأداة ستكون قادرة على دعم 
استخدام السفن بطريقة أفضل كما أنها تساعد في اختيار السفن (مثل: عةتصهصه 
مقابل «هدصقة) وتصميم جداول التوجيه الأمثل فإن ذلك من شأنه تحقيق هدف 
خفض تكاليف الشحن بالإضافة إلى خفض النفقات الخاصة بغرامات التأخير. وينوي 
الباحثون مواصلة البحث عن طريق استكشاف أساليب رياضية أخرى بديلة من أجل 
حل مشكلة الجدولة. كما أنهم يعتزمون أيضًا منح lal‏ أنظمة دعم القرار القدرةً على 
النظر في منتجات متعددة لمجموعة من السفن. 

أسئلة للمناقشة: 

-١‏ اذكر ثلاث طرق توضح كيف هكن أن تؤدي الجدولة اليدوية للسفن إلى تحمّل 
المزيد من التكاليف التشغيلية مقارنةٌ بالأداة التي تم تطويرها. 

- كيف يمكن لشركة إكسون موبيل الاستفادة بطرق أخرى من أدوات دعم القرار 
التي تم تطويرها من أجل توسيع وتحسين عملياتها التجارية الأخرى؟ 

- ما هي بعض القرارات الإستراتيجية التي يمكن اتخاذها من قبل صناع القرار 
باستخدام الأداة التي تم تطويرها؟ 
Source: Adapted from Furman, K. C., Song, J. H., Kocis, G. R., McDonald, M. K.,‏ 


& Warrick, P. H. (2011). Feedstock routing in the ExxonMobil downstream sector. 
Interfaces, 41(2), 149163-. 


أمثلة نموذج تحليلات توجيهية: 


تعتمد التحليلات التوجيهية على النمذجة كعنصر أسامي. وفي الأمثلة التي ذكرناها آنا في 
حالات التقديم والتطبيق ينبغي على الفرد استخدام نموذج رياضي حتى يتمكن من التوصية بقرار 
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لأي مشكلة واقعية. فعلى سبيل ال مثال» نجد أن تحديد العميل (من بين ملايين العملاء ا محتملين) 
الذي سوف يتلقى عرضًا بغرض تعظيم قيمة الاستجابة الإجمالية مع التقيد بحدود اميزانية. ليس 
بالأمر الذي يمكنك القيام به يدويًا. وبناء نموذج زيادة الاستجابة إلى الحد الأقصى المستند إلى 
الاحتمالية مع التقيد بحدود الميزانيةء من شأنه أن يوفر لنا المعلومات التي ننشدها. واستنادًا إلى 
المشكلة التي نتناولهاء فإن هناك فئات عديدة من النماذج, بالإضافة إلى أنه غالبًا ما يكون هناك 
العديد من التقنيات المتخصصة لحل كل مشكلة منها. وفي هذا الفصل سوف نتعرف على اثنين من 
أساليب النمذجة المختلفة. ومن الجدير بالذكر أن معظم الجامعات لديها العديد من الدورات 
التدريبية التي تغطي هذه الموضوعات تحت عناوين مختلفة مثل بحوث العمليات» وعلوم الإدارة 
ونُظم دعم القرار» والمحاكاة التي يمكنها مساعدتك في بناء المزيد من الخبرات في هذه المواضيع. 
ونظرًا لأن التحليلات التوجيهية تنطوي عادةً على تطبيق نماذج رياضية, فإن مصطلح علم البيانات 
أحيانًا يرتبط بتطبيق مثل هذه النماذج الرياضية بشكل أكثر انتشارًا. وقبل أن نتعرف على دعم 
النمذجة الرياضية في التحليلات التوجيهيةء دعونا نفهم أولًا بعض مشاكل النماذج. 
تحديد المشكلة والتحليل البيئي: 

لا يتم اتخاذ القرارات من فراغ بل لابد من تحليل نطاق المجال وقوى وديناميكيات البيئة. 
حيث يحتاج صانع القرار إلى تحديد الثقافة التنظيمية وعمليات صنع القرار في الشركات (على 
سبيل المثال: من يقوم باتخاذ القرارات» ودرجة المركزية). فمن الوارد أن يكون ظهور المشكلة 
الحالية سببه العوامل البيئيةء وهذا قد يسمى بشكل رسمي المسح والتحليل البيئي» ويقصد به 
رصد المعلومات المجمعة ومسحها وتفسيرها. ويمكن لأدوات ذكاء الأعمال / تحليلات الأعمال 
ol (BI/BA)‏ تساعد في تحديد المشاكل عن طريق القيام بعملية مسح لها. وينبغي أن تكون 
المشكلة مفهومة جيدًا كما يجب أن يشارك الجميع نفس إطار الفهم نظرًا لأن المشكلة سوف 
يتم تمثيلها في النهاية بالنموذج بشكل أو بآخر. وبغير ذلك فإن النموذج لن يساعد صانع القرار. 

تحديد المتغير: يُعد تحديد متغيرات النموذج (مثل: القرارء والنتيجةء وعدم التحكم فيهما)» 
بالإضافة إلى العلاقات بين المتغيرات» أمرًا بالغ الأهمية. ويمكن أن يكون لتأثير الرسوم البيانية 
-والتي تعد نماذج تخطيطية للنماذج الرياضية - دور في تسهيل عملية التحديد. كما قد يساعد 
شكل أكثر عمومية لرسم بياني مؤثر وخريطة معرفية» صانع القرار على تطوير فهم المشكلة 
بشكل أفضلء لاسيما المتغيرات وتفاعلاتها. 

التنبؤ (تحليلات توجيهية): وكما ذكرنا سابقًاء فإن معرفة ما حدث وما هو محتمل حدوثه 
يُعد شرطًا أساسيًا هاما للتحليلات التوضيحية. ويُعتبر هذا النوع من التحليلات التنبؤية ضروريًا 
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لبناء النماذج ومعالجتها نظرًا لأن النتائج المترتبة على تنفيذ القرار عادةٌ ما تظهر في المستقبل. 
وليس هناك جدوى من إجراء تحليل ملعرفة مدى (الاستجابة) على ما وق في امماضي لأن القرارات 
التي سيتم اتخاذها في ذلك الوقت لن تُجدي نفعًا في المستقبل. وتتطلب التجارة عبر الإنترنت 
والاتصالات التنبؤ بما قد يحدث وتوافر المعلومات المتاحة من أجل أدائها. وهذه الأنشطة تحدث 
Åe pus‏ بعد جمع المعلومات حول ال مشتريات والتي ينبغي تحليلها للوصول إلى التوقعات» حيث 
ينطوي جزء من التحليل ببساطة على التنبؤ بالطلب؛ ومع ذلك فإن نموذج التنبؤ يمكنه استخدام 
احتياجات دورة حياة المنتج والمعلومات التي تتعلق بالسوق وامستهلكين لتحليل الوضع بأكمله 
مما يؤدي إلى زيادة مبيعات المنتجات والخدمات بشكل مثالي. 

وفي الحالة العملية (1-؟) سوف نقدم وصفًا لمثال فعال يمثل هذه التنبؤات واستخدامها في صنع القرار. 


Y las dll» 
استخدام تطبيقات ذكاء الأعمال من قبل شركة إنجرام مايكرو 21150 منهدروه1 من‎ 
أجل اتخاذ قرارات التسعير‎ 

تد شركة إنجرام مایکرو c۲٥‏ 1۸8۵۳ ھی أكبر موزع ثنائي المستوى منتجات 
التقنية في العالم. وتقوم الشركة في نظام التوزيع ذي الشقينء بشراء المنتجات من الشركات 
المصنعة لها ومن ثَّم تقوم ببيعها لتجار التجزئة الذين يقومون بدورهم ببيع هذه المنتجات 
للمستخدمين النهائيين. فمثلًا. مكن شراء حزمة 365 01368 :11150501 من شركة 
إنجرام مايكرو 3010 lilà o Jas Ingram‏ مباشرة من مايكروسوفت 05010 1/1). 
وترتبط شركة إنجرام بالعديد من الشراكات مع شركات مثل تإناظ -Buffalos .Best‏ 5 
Honeywell «Google‏ بالإضافة إلى åS Jl eis .Sharper Images .Libratone‏ 
بتسليم منتجاتها إلى ٠٠٠٠٠٠١‏ مزود حلول في جميع أنحاء العام, وبالتالي فإن الشركة لديها 
حجم كبير من بيانات المعاملات. ولتحديد فرص البيع المتقاطع وتحديد الأمعار التي 
يتم تقدهها لعملاء محددين بالتزامن مع حزم ا منتجات» أرادت شركة إنجرام استخدام 
الإحصاءات من هذه البيانات. مما يتطلب إنشاء مركز ذكاء الأعمال (810) من أجل 
تجميع وتحليل البيانات. وقد واجهت شركة إنجرام العديد من المشاكل في إعداد 810. 
-١‏ واجهت شركة إنجرام مشاكل عديدة في عملية التقاط البيانات الخاصة «eap‏ مثل 
نقص بيانات الخسائرء وضمان دقة معلومات المستخدم النهاقء وربط. الاقتباسات بالأوامر. 





(CRM) Mall SEMs özlə) واجهت شركة إنجرام مشاكل في تنفيذ نظام‎ Lf -Y 
بحيث يكون قادرًا ما يكفي للتعامل مع عملياته في جميع أنحاء العام.‎ 
ova ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري‎ 


الفصل السادس 


"- بالإضافة إلى ما سبقء فقد واجهت الشركة تصدي لفكرة تسعير الطلب (تحديد 
السعر وفقًا للإقبال على المنتج). 

المنهجية / الحل: 

استكشفت شركة إنجرام البريد الإلكتروني واستخدمته في التواصل المباشر مع عملائها 
(البائتعين) وقدمت لهم خصومات على شراء التقنيات الداعمة المتعلقة بالمنتجات 
المطلوبة. ومن خلال تحليل سلة السوق المجزأة استطاعوا تحديد هذه الفرص ومن 
نم طوروا تطبيقات ذكاء الأعمال التالية التي ساعدت في تحديد الأسعر المثلى. كما 
قامت إنجرام بتطوير أداة جديدة لتحسين الأسعار وتٌعرف باسم 11۲۸1۸٤‏ وهذه 
الأداة يمكنها تحديد الأسعار القائمة على البيانات بالإضافة إلى قدرتها على توفير إرشادات 
التفاوض المستندة إلى البيانات. حيث تحدد :1315121311 السعر الأمثل لكل مستوى 
من مستويات التسلسل الهرمي للمنتج (مثل: مستوى العميلء ومستوى البائع-العميل. 
ومستوى شريحة العميل» ومستوى شريحة البائع-العميل). وهي تقوم بفعل ذلك من 
خلال مراعاة المفاضلة بين إشارة الطلب والتسعير عند ذلك المستوى. 

كما قامت الشركة بتطوير برنامج تسويق رقمي يُعرف باسم 1210614826 #عمعع لاع امل 
حيث يستخدم هذا البرنامج التسجيل الإرشادي التنبؤي (۲18)» والذي يحدد 
المستخدمين النهائيين المُستَهدَفين ببرامج تسويقية محددة. (PLS) Axis‏ هو نظامهم 
الذي يُستخدم لتسجيل الإرشادات التنبؤية للشركات التي ليس لها علاقة مباشرة مع 
المستخدمين النهائيين. كما يُستخدم برنامج 18161434 #عمعع !!!]12 لتشغيل برامج 
الفضاء الأبيض» مما يُشجع المورّد على شراء المنتجات المرتبطة ببعضها من خلال تقديم 
خصومات. فعلى سبيل المثالء إذا كان امْوَرّد يشتري خادمًا من إنجرام» فعندئذٍ تقوم 
إنجرام بتقديم خصومات على وحدات تخزين الأقراص نظرًا للترابط بين المنتجين. حيث 
إنهما مطلوبان للعمل da‏ وبامثل؛ alò‏ يتم استخدIم‏ 45 Intelligence INGRAM‏ 
من أجل تطوير الحملات التحفيزية (وذلك من خلال تقديم مكافآت نقدية للموردين 
على تجاوز أهداف الإنفاق الربع سنوية)» وحملات البيع المتبادل (إرسال البريد الإلكتروني 
للمستخدمين بخصوص النتجات المرتبطة بالمنتج الذي تم شراؤه مؤخرًا). 

النتائج / الفوائد: 

وتُستخدم منهجية قياس الرفع لقياس الأرباح الناتجة وذلك عن طريق استخدام 
أداة 12151813478؛ حيث تقوم هذه المنهجية (منهجية قياس الرفع) بمقارنة الفترات قبل 


ote‏ ذكاء الأعمال والتحليلات وعلم OBLI‏ منظور إداري 


التحليلات التوجيهية: التحسين والمحاكاة 


وبعد تغيير الأسعار كما تقوم بمقارنة مجموعات الاختبار مقابل مجموعات التحكم. 
ويتم إجراء قياس الرفع على متوسط المبيعات اليومية والهامش الإجمالي» وهامش 
الماكينة. وقد أدى استخدام أداة 11015112415 إلى نمو في الإيرادات VOV èl‏ مليون دولار 
وزيادة في إجمالي الأرباح بلغت ۱۸,۸ مليون دولار. 

أسئلة للمناقشة: 

-١‏ ما هي أهم التحديات التي واجهتها إنجرام مايكرو Mi‏ ۳ عہ! فی تطوير 810؟ 

۲- اذكر جميع حلول ذكاء الأعمال التي طورتها شركة إنجرام لتحسين أسعار منتجاتها 


وللتعرف على عملائها. 
- ما هي الفوائد التي حصلت عليها إنجرام بعد استخدام تطبيقات ذكاء الأعمال 
المطورة حديئًا؟ 


ما الذي يمكن أن نتعلمه من هذه الحالة العملية؟ 

تستطيع الشركة أن تبدأ بفهم خطوط منتجاتهاء وعملائهاء بالإضافة إلى أنماط الشراء 
الخاصة بهم بشكل أفضلء من خلال بناء 810 لأول مرة. وتُستمّد هذه البصيرة من ما 
نسميه بالتحليلات الوصفية والتنبؤية. وبالإضافة إلى ذلك. فإن القيمة من هذا تُسِتَمّد 
من خلال تحسين الأسعارء وهو أحد مجالات التحليلات التوجيهية. 
Sources: Mookherjee, R., Martineau, J., Xu, L., Gullo, M., Zhou, K., Hazlewood,‏ 
A., Zhang, X., Griarte, E, & Li, N. (2016). End-to-end predictive analytics and‏ 
optimization in Ingram Micros two-tier distribution business. Interfaces, 46(1), 4973-;‏ 


ingrammicrocommerce.com, "CUSTOMERS; https://www.ingrammicrocommerce. 


com/customers/(accessed July 2016). 


فئات النموذج: 

يصنف الجدول (1-1) بعض نماذج القرارات إلى سبع مجموعات ويسرد العديد من التقنيات 
الممثلة لكل فئة من الفئات؛ حيث يمكن تطبيق كل تقنية إما على نموذج ثابت أو نموذج حري 
والذي يمكن بناؤه في بيئتات مفترضة من التأكد. أو عدم التأكد. أو الخطر. ويمكن استخدام أنظمة 
تحليل القرارات الخاصة والتي يحتوي تصميمها على لغات وإمكانيات نمذجة مدمجة فيهاء بغرض 
تسريع عملية البناء النموذجية, ويش مل ذلك جداول البيانات» وأنظمة التنقيب في البيانات» 
وأنظمة المعالجة التحليلية عبر الإنترنت (01.88). ولغات النمذجة التي تساعد المحلل على بناء 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري of!‏ 


هذه الإدارة بمساعدة أنظمة الإدارة القائمة على النماذج» 


الفصل السادس 


نموذج. وسوف نتناول أحد هذه الأنظمة لاحقًا في هذا الفصل. 
إدارة النموذج: وللحفاظ على سلامة النماذج وبالتالي قابليتها للتطبيق فإنه ينبغي أن نتم 


As 


حيث تتم 


إدارة النماذج» مثل البيانات؛ 


والتي تشبه أنظمة إدارة (DBMS) OLLI aslo‏ 
النمذجة المستندة إلى ا معرفة: تستخدم أنظمة دعم القرار النماذج الكمية في الغالب» في حين 
تستخدم النظم الخبيرة نماذج نوعية تعتمد على المعرفة في تطبيقاتها. الجدير بالذكر أن بعض اب معرفة 
تكون ضرورية لبناء نماذج قابلة Jal‏ (وبالتالي فإنها تكون قابلة للاستخدام). ولبناء نماذج قائمة على 
المعرفة, فإنه يمكن استخدام العديد من تقنيات التحليلات التنبؤيةء مثل: التصنيف والتجميع. 


جدول 1-5: فئات النماذج 





التقنيات الممثلة 


العملية والهدف 


ati 





جداول القرارات. وأشجار 
القرارء وعملية التسلسل الهرمي 
التحليلي. 


البحث عن أفضل حل من بين 
عدد قليل من البدائل. 


البحث عن الحل الأمثل للمشاكل 
من خلال بعض البدائل القليلة. 





نماذج البرمجة الخطية والرياضية 
الأخرىء ونماذج الشبكات. 


بعض نماذج المخزون. 


البحث عن أفضل حل من بين 
عدد كبير من البدائل. باستخدام 
عملية التحسين خطوة بخطوة. 

البحث عن أفضل الحلول في 
خطوة واحدة باستخدام صيغة ما. 


البحث عن الحل الأمثل عن 
طريق خوارزمية. 


البحث عن الحل الأمثل من 























المحاكاة. البحث عن حل جيد بدرجة كافية | عدة أنواع من المحاكاة. 
أو الحل الأفضل من بين البدائل 
التي تم فحصهاء وذلك من خلال 
استخدام التجريب. 
الاستدلال. العثور على حل جيد بدرجة كافية. | برمجة إرشاديةء وأنظمة خبيرة. 
عن طريق استخدام القواعد. 
otv‏ ذكاء الأعمال والتحليلات وعلم البيانات. منظور إداري 


التحليلات التوجيهية: التحسين والمحاكاة 











الفئة العملية والهدف التقنيات الممثلة 
تماذج تنبؤية. التنبق با مستقبل بالنسبة لسيناريو | نماذج التنبق وتحليل ماركوف 
معين. .Markof‏ 
تماذج أخرى. وضع حل في حالة ”ماذا - لو“ | النمذجة الالية. وخطوط 
باستخدام صيغة ما. الانتظار. 

















الاتجاهات الحالية في النمذجة: ينطوى أحد الاتجاهات الحديثة في النمذجة على تطوير مكتبات 
نموذجية ومكتبات تقنية الحل. وبعض هذه الرموز يمكن تشغيلها مباشرةً على خادم الويب الخاص 
بالمالك مجانّه والبعض الآخر يمكن تنزيله وتشغيله على جهاز حاسب محلي حيث إن توافر هذه 
الرموز يعني أن حزم التحسين والمحاكاة القوية متاحة لصانعي القرار الذين من الممكن أن يقوموا 
باختبار هذه الأدوات فقط من منظور مشاكل الفصل الدراسي. فعلى سبيل المثالء يحتفظ قسم 
الرياضيات وعلوم الحاسب في مختبر أرغون (Argonne, Illinois) Argonne National, ib g)‏ 
بخادم 95 من أجل التحسين على LS. .https;//neos-server.org/neos/index.html a352‏ 
يمكنك العثور على روابط لمواقع أخرى عن طريق النقر على رابط الم وارد في الموقع. 0:8 الموقع 
الإلكتروني معهد بحوث العمليات وعلوم الإدارة (18801780/5), حيث يوفر 1215801045 معلومات 
غزيرة حول النمذجة والحلول. ويمثل موقع '(1048 08/315 الموقع الإلكتروني لأحد منشورات 
Shortly xà GS .http///www.ormstoday.org/ormsmain : Je eLs 5535 INFORMS‏ 
روابط للعديد من فئات برامج النمذجة. وسوف نتناول بعصًا منها K‏ 


وهناك اتجاه واضح نحو تطوير واستخدام أدوات وبرامج تسمى cloud-based‏ من أجل 
الوصول إلى البرامج وحتى تشغيلها من أجل أداء النمذجة والتحسين والمحاكاة وما إلى ذلك. وهذا 
يبسط تطبيق العديد من النماذج لمشاكل العام الحقيقي بطرق عديدة. ومع ذلك فمن الضروري 
اكتساب الخبرة جيدًا من خلال تطوير الحلول البسيطة» وذلك من أجل استخدام النماذج وتقنيات 
الحلول بفاعلية. وغالبًا ما يتم تجاهل هذ! الجانب. فالمنظمات التي لديها مُحللين رئيسين والذين 
يدركون بالفعل كيفية تطبيق النماذج» يطبقونها بفاعلية كبيرة. وهذا يحدث بشكل ملحوظ في 
منطقة إدارة الإيرادات» والتي انتقلت من مقاطعة شركات الطيران والفنادق وتأجير السيارات 
إلى التجزئة والتأمين والترفيه والعديد من المجالات الأخرى. كما أن 0804 أيضًا تستخدم نماذج» 
غير أنها غالبًا ما تكون شفافة للمستخدم. وتعتبر كمية البيانات وأحجام النماذج كبيرة ga Vo‏ 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري ott‏ 


الفصل السادس 


النماذج الإداريةء مما يستدعي استخدام مستودعات البيانات لتوفير البيانات وأجهزة الحوسبة 
المتوازية للحصول على حلول في إطار زمني معقول. 

كما أن هناك اتجاهًا مستمرًا نحو جعل نماذج التحليلات واضحة تمامًا لصانع القرار. فعلى 
JELI Luew‏ ينطوى التحليل متعدد الأبعاد (النمذجة) على تحليل البيانات فى أبعاد متعددة. 
وتظهر البيانات بشكل عام في التحليل متعدد الأبعاد (النمذجة) على شكل دول Dllo‏ بحيث 
يكون معظم صناع القرار على دراية بها. ويستخدم الآن العديد من صناع القرار الذين اعتادوا 
على تشريح وتقطيع مكعبات البيانات» أنظمة 01.45 التي تصل إلى مستودعات البيانات. وعلى 
الرغم من أن هذه الطرق قد تجعل النمذجة مستساغة:. إلا أنها أيضًا تخرج العديد من فئات 
النماذج الهامة والقابلة للتطبيق من الاعتبارء كما أنها تقضي على بعض جوانب تفسير الحلول 
الهامة والدقيقة. وتتضمن النمذجة ما ه و أكثر بكثير من مجرد تحليل البيانات مع خطوط 
الانجاه وإقامة علاقات مع الأساليب الإحصائية. 

وهناك أيضًا اتجاه لبناء نمموذج من نموذج للمساعدة في تحليله بحيث يكون الرسم التخطيطي 
المؤثر عبارة عن تمثيل بياني لنموذج؛ وهذا هو ما يُقصد به نموذج من نموذج. كما أن بعض حزم 
برامج الرسم التخطيطي المؤثرة تستطيع إنشاء وحل النموذج الناتج. 
أسئلة مراجعة على القسم 9-5: 
-١‏ اذكر ثلاثة دروس مستفادة من النمذجة. 
-Y‏ اذكر مع الوصف المشاكل الرئيسة في النمذجة. 
*- ما هي الأنواع الرئيسة من النماذج المستخدمة في 57255 
ع- لماذا لا يتم استخدام النماذج في الصناعة بشكل متكرر كما ينبغي أو كما يمكن أن تكون؟ 
ه- ما هي الاتجاهات الحالية في النمذجة؟ 


٠-1‏ هيكل النماذج الرياضية لدعم القرار: 
في الأقسام التاليةء سوف نتناول موضوعات النماذج الرياضية التحليلية (كالنماذج الرياضية 
واطالية والهندسية). وسوف يتضمن ذلك عناصر وهياكل النماذج. 
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التحليلات التوجيهية: التحسين والمحاكاة 


مكونات النماذج الرياضية لدعم القرار: 

تتكون جميع النماذج الكمية عادةً من أربعة عناصر أساسية (انظر الشكل »)٠-١‏ وهي: متغيرات 
(outcome älvar] s) iail‏ ومتغيرات ils col‏ رات الغير قابلة للتحكم adl gl)‏ 
5ه بالإضافة إلى متغيرات النتائج المتوسطة: حيث تقوم العلاقات الرياضية بربط هذه 
العناصر ببعضها البعض. وتكون العلاقات رمزية أو نوعية في النماذج غير الكمية. وبناءً على القرار 
المتخذ (أي: قيم متغيرات القرار)» والعوامل التي لا يمكن التحكم فيها من قبل صانع القرار (في البيئة)» 
والعلاقات بين المتغيرات» فإنه يتم تحديد نتائج القرارات. وتنطوي عملية النمذجة على تحديد المتغيرات 
والعلاقات فيما بينهاء حيث يُحدد حل النموذج قيم هذه المتغيرات ومتغير (متغيرات) النتيجة. 


























شكل 1-5: الهيكل العام لنموذج كمي 


متغيرات النتيجة (الحصيلة :0171000111): تعكس متغيرات النتيجة (الحصيلة ©2درمء1نه) 
مدى فاعلية النظام؛ بمعنى أنها تشير إلى مدى جودة النظام أو تحقيق هدفه (أهدافه). وهذه 
المتغيرات هي مخرجات. وقد وردت أمثلة لمتغيرات النتائج في الجدول (1-"). وتعتبر متغيرات 
النتائج متغيرات تابعة. كما ُستخدم متغيرات النتائج المتوسطة أحيانًا في النمذجة لتحديد النتائج 
المتوسطة. ds‏ حالة المتغير التابع» ينبغي أولًّا وقوع حدث آخر قبل وقوع الحدث الموصوف بواسطة 
المتغير. وتعتمد متغيرات النتائج على حدوث متغيرات القرار والمتغيرات التي لا يمكن التحكم فيها. 

متغيرات القرار: تصف متغيرات القرار مسارات بديلة للعمل. ويتحكم صانع القرار في 
متغيرات القرار. فعلى سبيل ال مثال» بالنسبة لمش كلة الاستثمار, فإن مبلغ الاستثمار في السندات 
هو متغير القرار. وفي مشكلة الجدولة» فإن متغيرات القرار تكون أشخاصًا وأوقانًا وجداول. وقد 
وردت أمثلة أخرى à‏ الجدول (7-5). 

المتغيرات الغير قابلة للتحكم parameters SK Izl 5l‏ هناك عوامل تؤثر على متغيرات 
النتائج في أي موقف لاتخاذ القرارء غير أن هذه العوامل خارج نطاق سيطرة صانع القرار. وهذه 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري oto‏ 


الفصل السادس 


العوامل إما أن تكون ثابتةء وف هذه الحالة تسمى متغيرات غير قابلة للتحكم أو cles‏ 
ùÎ leg «parameters‏ تكون قابلة للتغين وقي هذه الحالة تسمى المتغيرات. ومن أمثلة العوامل 
سعر الفائدة الأساسي ورمز المباني في المدينة واللوائح الضريبية وتكاليف المرافق. ومعظم هذه 
العوامل لا يمكن التحكم فيها نظرًا لكونها موجودة ومحددة من قبل عناصر بيئة النظام التي 
يعمل فيها صانع القرار. كما أن بعض هذه المتغيرات يُقَيّد صانع القرارء وبالتالي فإنها تُشَّكل ما 
يُسمى بالقيود المفروضة على المشكلة. 

متغيرات النتائج ا لمتوسطة: تعكس متغيرات النتائج المتوسطة الحصيلة المتوسطة في النماذج 
الرياضية. فمثلاء عند تحديد جدولة الآلة. فإن التلف يكون هو متوسط متغير الناتج» ويكون 
الربح الإجمالي هو متغير النتيجة (أي إن التلف هو أحد العوامل المحددة لإجمالي الربح). ومثال 
آخر: هو رواتب الموظفينء ويُشكل هذا متغير قرار الإدارة؛ إذ يحدد مدى ارتياح الموظفين (أي: 
الحصيلة ا متوسطة)» والذي يحدد بدوره مستوى الإنتاجية (أي: النتيجة النهائية). 


جدول 8-5: أمثلة لعناصر النماذج 





























متغيرات ومَعْلَمَات 
المنطقة متغيرات القرار متغيرات النتيجة e‏ 
غير قابلة للتحكم 
الربح والخ 
مجموع الربح» والخطر مدل الت 
معدل العائد على الاستثمار (۸01) 
الاستثمار المالي | بدائل الاستثمار ومبالغه a‏ معدل الفائدة 
E P‏ 
pied teen‏ المنافسة 
مستوى السيولة 
ميزانية الإعلان الحصة التسويقية دخْل العميل 
التسويق ] . . R‏ 
مكان الإعلان رضا العملاء إجراءات المنافس 
نوعية اطنتج وكميته التكلفة الإجمالية سعة الماكينة 
التصنيع مستويات المخزون مستوى الجودة التقنية 
برامج التعويض ارتياح الموظف أسعار المواد 
0 تقنية الحاسب 
استخدام أجهزة الحاسب تكلفة معالجة البيانات : 5 
المحاسبة NA j‏ معدلات الضرائب 
^ جدول التدقيق تسبة الخظاً 
Y‏ 0 المتطليات القانونية 
ot1‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات التوجيهية: التحسين والمحاكاة 























lias Colo . 3‏ 
امنطقة متغيرات القرار متغيرات النتيجة 
مجموع تكلفة النقل 
جدول الشحنات 0 Ee‏ : مسافة التسليم 
وسائل النقل — ]| قيمة وقت الفراغ غعدمتروط 9 
استخدام البطاقات الذكية القوانين 
float time‏ 
الخدمات مستويات التوظيف ارتياح العملاء الطلب على الخدمات 





هيكل النماذج الرياضية لدعم القرار: 
ترتبط عناصر النموذج الكمي بواسطة التعبيرات الرياضية (الجبرية) - المعادلات أو التباين. 
وفيما يلي نموذج مالي بسيط جدًا © - 8 -ه. 


حيث 5 - الربح. و۸ = الإيرادات» و٤‏ = التكلفة. وتصف هذه ال معادلة العلاقة بين اممتغيرات. 
وهناك نموذج مالي آخر معروف هو نموذج التدفق النقدي البسيط للقيمة الحاليةء حيث ۴ = القيمة 


الحالية» و۴ = دفعة واحدة مستقبلية بالدولان و1 - سعر الفائدة (النسبة المئوية)» ومح عدد 
السنوات. ويمكن مع هذا النموذج تحديد القيمة الحالية لدفع مبلغ 35٠٠٠٠٠١‏ يتم سداده بعد 0 


سنوات من الیوم» ase‏ فائدة .)٠,1( “٠١‏ على النحو التالي: 2 د Avr eo (Se D Ves‏ 
وفيما يلي من أقسام سوف نقدم نماذج رياضية أكثر تشويقًا وتعقيدًا. 
أسئلة مراجعة على القسم 5-": 
-١‏ ما هو متغير القرار؟ 
۲- اذكر وناقش بإيجاز العناصر الرئيسة للنموذج الكمي. 
۳- اشرح دور متغيرات النتائج المتوسطة. 
٠-٦‏ التأكد وعدم التأكد والخطر: 
تنطوي عملية اتخاذ القرار على تقييم ومقارنة البدائل. ومن الضروري خلال هذه العملية, 
التنبؤ بالنتائج المستقبلية لكل بديل مقترح. وغالبًا ما يتم تصنيف حالات القرار على أساس ما 
يعرفه (أو ما يعتقده) صانع القرار بشأن النتائج المتوقعة. وعادةً ما نقوم بتصنيف هذه المعرفة 
إلى ثلاث فئات (انظر الشكل »)۲-١‏ بد١‏ من المعرفة الكاملة إلى الجهل الكاملء وهي: 
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الفصل السادس 


- التأكد. - عدم التأكد. - الخطر. 

وقد تحدث أي حالة من هذه الحالات عندما نقوم بتطوير النماذج» ولكل حالة أنواع 
مختلفة من النماذج تكون مناسبة لها. وفيما يلي سوف نناقش كلا من التعريفات الأساسية لهذه 
المصطلحات وبعض قضايا النمذجة الهامة لكل حالة. 








الجهل التام " المعرفة الكاملة 
عدم التأكد الخطر التأكد 











ب —— 
المعرفة المتناقضة 











شكل 7-5: مناطق اتخاذ القرار 

اتخاذ القرار في ظل التأكد: 

من المفترض أن المعرفة الكاملة تكون متاحة بالنسبة لصانع القرار عند اتخاذ القرار في ظل 
التأكدء بحيث يكون صانع القرار على علم تام بنتيجة كل مسار من العمل (كما لو كان في بيئة 
حتمية). وقد لا يكون صحيحًا أن معرفة النتائج تكون بنسبة 0٠٠١‏ كما لا يلزم إجراء تقييم 
حقيقي لكل النتائج» غير أنه غالبًا ما يقوم هذا الافتراض بتبسيط النموذج ويجعله قابلًا للتتبعع 
حيث يُنظر إلى صانع القرار على اعتبار أنه متنبئ مثالي للمستقبل نظرًا لأنه من المفترض أن هناك 
نتيجة واحدة فقط لكل بديل. فعلى سبيل ال مثالء بديل الاستثمار في سندات الخزانة الأمريكية 
هو الذي تتوفر به معلومات كاملة حول عائد الاستثمار المستقبلي إذا تم الاحتفاظ به حتى 
الاستحقاق. وغالبًا ما تحدث حالة اتخاذ القرار في ظل التأكدء مع مشاكل هيكلية وآفاق زمنية 
قصيرة (تصل إلى سنة واحدة). وعد النماذج القائمة على التأكد سهلة نسبيًا في تطويرها وحلهاء 
كما يمكنها تقديم الحلول uL‏ ويتم إنشاء العديد من النماذج المالية في ظل تأكد مفترضء على 
الرغم من أن السوق لا يقبل إلا بدرجة Nee aS‏ 


اتخاذ القرار في ظل عدم التأكد: 


في حالة اتخاذ القرار في ظل عدم التأكدء فإن صانع القرار يأخذ في الاعتبار الحالات التي تكون 
فيها عدة نتائج ممكنة لكل مسار عمل. وهذه الحالة على النقيض من وضع الخطرء حيث إن صانع 


مه ذكاء الأعمال والتحليلات وعلم البيانات. منظور إداري 


التحليلات التوجيهية: التحسين والمحاكاة 


القرار في هذه الحالة لا يعرف أو لا يمكنه تقدير احتمالية حدوث النتائج الممكنة. ويُعد اتخاذ 
القرار في ظل عدم التأكد أكثر صعوبة من اتخاذه في ظل التأكد بسبب عدم توافر معلومات كافية. 
وينطوي وضع النماذج لمثل هذه الحالات على تقييم موقف صانع القرار (أو المنظمة) تجاه الخطر. 

ويحاول المديرون تجنب حالة عدم التأكد قدر الإمكانء إلى الدرجة التي تجعلهم يستبعدونه 
حتى من مجرد الافتراض. فهم يحاولون الحصول على مزيد من المعلومات بحيث يمكن التعامل 
مع المشكلة في ظل التأكد (لأنه قد يكون «شبه» مؤكد) أو تحت خطر محسوب (أي: مفترض). 
وفي حالة عدم توفر المزيد من المعلومات» ينبغي معالجة المشكلة تبعًا لحالة عدم التأكد. والتي 
قد تكون أقل تحديدًا من الفئات الأخرى. 


اتخاذ القرار في ظل الخطر (تحليل الخطر): 

يُقصد بالقرار الذي يُتخذ في ظل الخطر (المعروف أيضًا بحالة اتخاذ القرار الاحتمالي أو العشوائي) 
بأنه القرار الذي يجب أن يأخذ فيه صانع القرار بعين الاعتبار عدة نتائج ممكنة لكل بديل» ولكل 
منها احتمال حدوث معين. ومن المفترض أن تكون احتمالات حدوث النتائج المحددة على الممدى 
الطويل معروفة أو يمكن تقديرها. ومن خلال هذه الافتراضات» يستطيع صانع القرار تقييم درجة 
الخطر المرتبط بكل بديل (يسمى الخطر المحسوب). ومن الجدير بالذكر أن معظم القرارات 
التجارية الرئيسة يتم اتخاذها في ظل الخطر المفترض. أما تحليل الخطر (أي: الخطر المحسوب) 
فهي طريقة صنع القرار التي تحلل الخطر (بناءً على الاحتمالات المعروفة المفترضة) الرتبطة بالبدائل 
المختلفة. ويمكن إجراء تحليل الخطر عن طريق حساب القيمة المتوقعة لكل بديل واختيار البديل 
ذي القيمة المتوقعة الأفضل. وتوضح الحالة العملية (1-") تطبيقًا واحدًا نتقليل عدم التأكد. 


حالة عملية 5لا 
استخدام الخطوط الجوية الأمريكية نمذجة التكلفة اللازمة لتقييم عدم التأكد من 
عطاءات طرق الشحن 
تُعد شركة S1 sa (AA) American Airlines, Inc 4.52 «Vl d552Jl Jo slasJl‏ 
شركات الطيران في العام. وأما الأعمال الأساسية للشركة فتتمثل في نقل الركابء بالإضافة 
إلى أن لديها وظائف فرعية حيوية أخرى تتضمن الشحن الكامل للشاحنات oe (FTL)‏ 
معدات الصيانة وشحنات بنود خدمة المسافرين والتي همكنها إضافة ما يزيد عن مليار 
دولار في المخزون في أي وقت. وتتلقى 484 عروض عديدة من الموردين استجابةٌ لطلبات 
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الفصل السادس 


عروض الأسعار Je] o» requests for quotes (RFQs)‏ قوائم الجرد. وقد يزيد إجمالي 
طلبات عروض الأسعار ۸۴۵۶ لشركة 44 عن ٠٠١‏ طلب عرض أسعار في أي عام. ونتيجة 
للعدد الكبير من عروض التسعير وعملية تقديم العطاءات ا معقدة الناتجة. فإن عروض 
أسعار الإعلانات تختلف بشكل كبير. وفي بعض الأحيانء فإنه يمكن لعقد واحد الانحراف 
بنحو .۲٠١‏ ونتيجة لهذه العملية المعقدة, فإنه من الشائح قيام الموردين إما بدفع مبالخ 
زائدة أو عدم دفعها من أجل الحصول على خدماتهم. وتحقيقًا لهذه الغاية فقد أرادت 
شركة الخطوط الأمريكية الجوية بناء نموذج شراء من شأنه تبسيط وتقييم عروض الأسعار 
من الموردين من أجل اختيار عروض أسعار عادلة لكلا الطرفين ومورديهم. 

المنهجية / الحل: 

وقد تم اتخاذ ثلاث خطوات. لتحديد التكلفة العادلة منتجات وخدمات الموردين» وهي: 

-١‏ استقصاء المصادر الأساسية (كال مقابلات) والثانوية (كالإنترنت) بحا عن الحالة الأساسية 
وبيانات المجال والتي من شأنها الإخبار عن متغيرات التكلفة التي تؤثر على عرض .811. 

lasl -Y‏ متغيرات التكلفة بحيث تكون حصرية تبادلية وجماعية شاملة. 

۳- استخدام برنامج تحلیل قرار 0۲1 لتوضیح عدم التأکد. 

US de bodes‏ فقد استخدمت 3168111 دهوصة”50 التقريب الموسع لنمذجة 
توزيع الاحتمالات للمتغيرات الأكثر حساسية من حيث التكلفة المستخدمة. وقد تم 
ذلك لحساب التقلبات العالية في عروض الأسعار في النموذج الأولي. 

النتائج / الفوائد: 

تم إجراء اختبار تجريبي على طلبات عروض الأسعار التي جذبت عروض من ست 
ناقلات ۴11. وقد كان من بين العروض الست المقدمة خمسة عروض ضمن ثلاثة 
انحرافات معيارية عن المتوسطء في etul go‏ السادس. وقد استخدمت 4۸ في وقت 
لاحق تموذج ۴۲1 للتكلفة اللازمة لأكثر من ٠٠١‏ طلب سعر ۸۴۵۶ من أجل تحديد 
التكلفة العادلة والدقيقة للسلع والخدمات. ومن المتوقع أن يساعد هذا النموذج في 
الحد من الأخطار التي تتعلق إما بالدفع الزائد أو دفع تعويضات للموردين. 

أسئلة للمناقشة: 


-١‏ إلى جانب الحد من خطر الدقع الزائد أو دفع تعويضات للموردينء ما هي بعض 
المميزات الأخرى التي تستطيع شركة 44 أن تستمدها من «تموذج ما ينبغي أن يكون»؟ 


.00 ذكاء الأعمال والتحليلات وعلم البيانات. منظور إداري 
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à I LSG da -Y‏ المجالات الأخرى التي يمكن استخدام هذا النموذج فيها 
إلى جانب مجال النقل الجوي؟ 

- ناقش الطرق الأخرى الممكنة التي تستطيع من خلالها شركة 44 أن تحل مشكلة 
دفع مبالغ زائدة ومقدار المدفوعات. 
Source: Adapted from Bailey, M. J., Snapp, J., Yetur, S., Stonebraker, S., Edwards, S.‏ 
A., Davis, A., & Cox, R. (2011). Practice summaries: American Airlines uses should-‏ 


cost modeling to assess the uncertainty of bids for its full-truckload shipment routes. 


Interfaces, 41(2), 194196-. 


أسئلة مراجعة على القسم 4-5: 
-١‏ وضح معنى القيام بعملية اتخاذ القرار في ظل التأكد المفترضء والخطرء وعدم التأكد. 
۲- كيف هكن التعامل مع مشاكل صنع القرار في ظل التأكد المفترض؟ 
۴- كيف هكن معالجة مشاكل صنع القرار في ظل عدم التأكد اممفترض؟ 
-٤‏ كيف هكن التعامل مع مشاكل صنع القرار في ظل الخطر المفترض؟ 
0-5 نمذجة القرار باستخدام جداول البيانات: 

يمكن تطوير النماذج وتنفيذها في مجموعة متنوعة من لغات البرمجة والأنظمة. ونحن نركز 
في المقام الأول على جداول البيانات (مع إضافاتهم)» ونماذج اللغات» بالإضافة إلى أدوات تحليل 
البيانات الواضحة. وسرعان ما تم الاعتراف بحزم جداول البيانات باعتبارها برنامج تنفيذ يمكن 
استخدامه بسهولة من أجل تطوير مجموعة واسعة من التطبيقات فى مجال الأعمال والهندسة 
والرياضيات والعلوم. وتشتمل جداول البيانات على الإحصائيات والتوقعات الشاملة: بالإضافة 
إلى التصميمات الأخرىء وقدرات إدارة قواعد البيانات» والمهام» والروتين. وقد تم تطوير الوظائف 
الإضافية مع تطور حزم جداول البيانات» وذلك من أجل هيكلة وحل فئات معينة من النماذج. 
ومن بين الحزم المضافة. تم تطوير العديد منها من أجل تطوير 255. وتتضمن هذه الوظائف 
الإضافية المرتبطة بأنظمة دعم القرار كلا من: 
(Frontline Systems Inc., solver.com) Solver -‏ 
Lindo رlصإ)‎ !What'sBest -‏ من نظمة à» (Inc., lindo.com; Lindo Systems gil‏ 

أجل الأداء الخطي والغير خطي الأمثل. 
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-(urik Research Software, Inc., jurikres.com) Braincel - 
(Palisade Corp., palisade.com) Neural Tools iwas! الأدوات‎ - 
„artificial neural networks ةıعliطصالا الشبكات العصبية‎ - 
للخوارزميات الجينية.‎ )Paاisade‎ Corp) Evolver bU - 
الخطر 1151© (م01© 115306ه) لأداء دراسات المحاكاة.‎ - 

وتتوفر الوظائف الإضافية القابلة للمقارنة مجانًا أو بتكلفة منخفضة جدًا. (يمكنك إجراء 
بحث على الويب حتى تتمكن من الوصول إليها؛ فهي مثابة إضافة جديدة منتظمة إلى السوق). 
ونظرًا لأن جدول البيانات يضم العديد من الوظائف المالية والإحصائية والرياضية وغيرها من 
الوظائف القويةء فهو يُعد أداة النمذجة الأوسع انتشارًا للمستخدم النهائي. وتستطيع جداول 
البيانات تنفيذ مهام الحلول النموذجية مثل البرمجة الخطية وتحليل الانحدار. وقد تطور جدول 
البيانات إلى أداة مهمة للتحليل والتخطيط والنمذجة )|نضر Farasyn, Perkoz, & Van de Velde,‏ 
Hurley & Balez, 2008; Ovchinnikov & Milner, 2008‏ ;2008(. وتقدم الحالتان العمليتان (5-5) 
و(0-5) تطبيقات مثيرة للاهتمام للنماذج المستندة إلى جداول البيانات في بيئة غير ربحية. 


حالة عملية 6-5 
استخدام بنسيلفينيا أدوبشن (Pennsylvania Adoption Exchange) il}‏ 
لنموذج جدول البيانات من أجل تحسين تطابق الأطفال مع الأسر 

تم تأسيس YAVA ele ( Pennsylvania Adoption Exchange (PAE)‏ من قبل 
ولاية بنسلفانيا لمساعدة المقاطعات والوكالات غير الهادفة للربح في العثور على عائلات 
محتملة للأطفال اليتامى الذين م يقم أحد بتبتّيهم بسبب العمر أو الاحتياجات الخاصة. 
وتحتفظ :241 بسجلات مفصلة عن الأطفال وتفضيلات الأسر التي من المحتمل أن تقوم 
بتبنيهم. كما تبحث عن عائلات للأطفال في جميع المقاطعات اللا" في ولاية بنسلفانيا. 
وتعد شبكة بنسلفانيا للتبنّي والاستدامة هي المسؤولة على مستوى الولاية عن إيجاد 
منازل دانمة للأيتام. فإذ! فشلت الشبكة بعد عدة محاولات في وضع طفل مع عائلةء فإنها 
حینئذ تحصل على مساعدة من ۲۸4۴. وتستخدم ۶4۴ أداة تقييم آلية لتنسيق وضع 
الأطفال مح العائلات المناسبة لهم.ء حيث تقدم هذه الأداة توصيات للتوفيق من خلال 
حساب النتيجة بين ٠‏ و١٠٠‏ للطفل على ۷۸ زوجًا من قيم سمات الطفل والتفضيلات 
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العائلية. وقد كافحت PAE‏ لعدة سنوات من أجل إعطاء توصيات توفيق التبنّي بين 
الأطفال والأسر التي تناسبهم للأخصائيين المسؤولين عن حالات الأطفال. غير أنهم وجدوا 
صعوبة في إدارة قاعدة بيانات واسعة من الآطفال التي تم جمعها بمرور الوقت على 
مستوى جميع المقاطعات ال1۷. وقد قدمت خوارزمية البحث الرئيسة توصيات للتوفيق 
أثبتت أنها غير مثمرة للأخصائيين المسؤولين عن الحالات. ونتيجة لذلك؛ فقد زاد عدد 
الأطفال الذين لم يتم تبثيهم زيادة هائلة. وأصبحت الحاجة ملحة لإيجاد أسر لهؤلاء الأيتام. 

المنهجية / الحل: 

بدأت 288 بجمع المعلومات عن كل من الأيتام والعائلات عن طريق الاستطلاعات 
عبر الإنترنت والتي تشمل مجموعة جديدة من الأسئلة؛ حيث تعمل هذه الأسئلة على 
جمع المعلومات الخاصة بهوايات الطفل وتفضيلات الأخصائيين المسؤولين عن الأطفال 
للعائلات» وفثة الأطفال العمرية المفضلة من قبل العائلات. وقد أنشَأ :281 والأطباء 
الأخصائيون أداة لتوفيق جداول البيانات» وقد اشتملت هذه الأداة على مميزات إضافية 
إذا ما قورنت بالأداة الإضافية التي استُخدمت سابقًا. ويستطيع الأخصائيون المسؤولون 
عن الحالات في هذا النموذج تحديد أهمية السمات من أجل اختيار عائلة لطفل. 
فمثلا. إذا كانت إحدى العائلات لديها مجموعة محدودة من التفضيلات التي تتعلق 
بنوع الطفل» وعمره» وعرقه» فإن هذه العوامل هكن أن تصبح ذات أهمية أعلى. 
وبالإضافة إلى ذلكء فإن الأخصائيين امسؤولين عن الحالات يمكنهم أن يعطوا الأفضلية 
حول المقاطعة التي تقيم بها الأسرة. نظرًا لأهمية عامل العلاقة الاجتماعية بالنسبة 
للطفل. وتستطيع لجنة التوفيق باستخدام هذه الأداة مقارنة الطفل والأسرة في كل 
iaw‏ مما يؤدي إلى جعل قرار التوفيق بين كل من الأسرة والطفل أكثر دقة. 

النتائج / الفوائد: 

منذ أن بدأت 2481 باستخدام نموذج جدول البيانات الجديد من أجل التوفيق بين 
عائلة وأحد الأطفال. استطاعوا اتخاذ قرارات خاصة بالتوفيق أفضلء مما أدى إلى ارتفاع 
نسبة الأطفال الذين يحصلون على منزل دائم. 

وتمثل هذه الحالة القصيرة مثالًا واحدًّا من العديد من الأمثلة التي تستخدم جداول 
البيانات كأداة لدعم القرارء حيث يتم إنشاء نظام مطابقة أفضل بين رغبات العائلة 
التي ترغب في التبنّي وسمات الطفلء من خلال إنشاء نظام تسجيل بسيط لرغبة العائلة 
وسمة الطفل بحيث يتم الإبلاغ عن عدد أقل من حالات الرفض لأي من الجانبين. 
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أسئلة للمناقشة: 
-١‏ ما هي التحديات التي واجهتها PAE‏ أثناء اتخاذ قرارات توفيق حالات التبنّي؟ 
۲- ما هي مميزات أداة جدول البيانات الجديدة التي ساعدت ۴۸۴ في حل المشاكل 
التي تتعلق بالتوفيق بين عائلة وطفل؟ 
Source: Adapted from Slaugh, V. W., Akan, M., Kesten, O., & Unver, M. U. (2016).‏ 


The Pennsylvania Adoption Exchange improves its matching process. Interfaces, 
46(2), 133154-. 


حالة عملية 0-5 
استخدام مؤسسة مترو ميلز أون وييلز تريجر فالي 
à» Excel aliy (Metro Meals on Wheels Treasure Valley)‏ أجل البحث 
عن خطوط السير المُثلى للتسليم 

Meals on Wheels Association of America‏ (وتسمى الآن 
A alius (, 5 (Meals on Wheels America‏ غير ربحية تقوم بتقديم 
ما يقرب من مليون وجبة إلى منازل كبار السن المحتاجين عبر الولايات 
Meals on Wheels Treasure Valley 4 559 .54. 2M‏ منتاء31 فرعا محليًا 
(Idaho) sala)! $ Jas Meals on Wheels America J‏ حيث يحتوي هذا 
الفرع على فريق من السائقين المتطوعين الذين يستخدمون سياراتهم الشخصية 
كل يوم من أجل تقديم الوجبات إلى 8٠١‏ عميل على طول ١‏ مسارًا ويغطون 
مساحة تبلغ Y,V£O‏ كيلومتر مربع. 

وقد واجهت منظمة Meals on Wheels Treasure Valley‏ العديد من 
المشاكل. أما المشكلة الأولىء فقد تمثلت في تطلعهم إلى تقليل وقت التسليم حيث 
كان الطعام المطبوخ حساسًا لدرجة الحرارة ومن الممكن أن يفسد بسهولة. وقد 
كانوا يرغبون في توصيل الطعام المطبوخ في غضون ٠١‏ دقيقة من بعد مغادرة 
السائق من أجل توصيل الطعام. وأما المشكلة الثانية» فقد تمثلت في استغراق 
عملية الجدولة وقنّا طويلًا جدا. وقد قضى اثنان من الموظفين الكثير من وقتهم 
في تطوير مسارات مجدولة من أجل التوصيل. وقد قدم منسق خطوط السير 
بتحديد عدد مرات التوقف وفقًا لعدد متلقي الوجبات ليوم معين. وبعد تحديد 
نقاط التوقف. قام المنسق بعمل سلس لة من التوقفات التي قللت من وقت 
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سفر المتطوعين. وبعد ذلك يتم إدخال جدول خط السير في أداة عبر الإنترنت 
لتحويل تعليمات القيادة للسائقين. وقد كانت عملية تحديد خطوط السير يدويًا 
تستغرق الكثير من الوقت الإضافي. وتحتاج 312/58 إلى أداة تمكنها من تحسين 
نظام التوصيل الخاص بهم فضلًا عن قدرتها على تقديم حلول توجيه لكل من 
اتجاهات الذهاب والعودة لتوصيل وجبات الطعام. ويمكن لأولئك الذين يقودون 
بانتظام أن يقوموا بتوصيل الطعام الدافئ أو البارد في اليوم التالي. أما الأشخاص 
الآخرون الذين يقومون بقيادة السيارات فقط في بعض الأحيانء فإنهم يحتاجون 
إلى العودة إلى المطبخ أحيانًا لتوصيل الأطعمة الدافئة / المبردة. 
المنهجية / الحل: 

تم تطوير أداة تعتمد على جدول البيانات» من أجل حل مشكلة خط السير. 
حيث تحتوي هذه الأداة على واجهة لإدخال المعلومات الخاصة بالمستلم بسهولة 
مثل اسمه / اسمها ومتطلبات الوجبةء وعنوان التسليم» حيث ينبغي ملء هذه 
المعلومات في جدول البيانات لكل نقطة توقف في خط السيرء ثم بعد ذلك تم 
استخدام برنامج 8251 21ناؤة17 1:15 لوظيفة التطبيقات من أجل الوصول إلى 
واجهة برمجة تطبيقات خرائط الشبكة للمطورين (821) والتي تسمى 010©56م2/2. 
وقد تم استخدام هذه الواجهة الخاصة ببرمجة التطبيقات 421 لإنشاء مصفوفة 
سفر تقوم بحساب الوقت والمسافة اللازمة لتوصيل الوجبةء حيث تعطي هذه الأداة 
معلومات عن الوقت واممسافة ل٠٠٠٠‏ زوج من المواقع يوميًا بدون أي تكلفة. 

وعند بدء التشغيل يقوم 421 56©ن 0م112 أولًا بالتأكد من صحة العناوين 
المدخلة لمتلقي الوجبات. ثم يستخدم البرنامج واجهة برمجة التطبيقات (API)‏ 
للحصول على مسافة القيادةء والوقت المتوقع للقيادةء وتغيير التعليمات للقيادة 
بين جميع نقاط التوقف في الطريق. وبعد ذلك. تستطيع الأداة الوصول إلى ٠١‏ 
محطة خلال فترة زمنية ممكنة. 
النتائج / الفوائد: 

أدى استخدام هذه الأداة. إلى انخفاض إجمالي مسافة القيادة السنوية بمقدار 
٠‏ ميلء بينما قل وقت السفر بمقدار 01٠‏ ساعة. وقد وفرت وحبات 1/60 
à $0,^- - Meals on Wheels Treasure Valley‏ عام ۰٥‏ اعتمادًا على معدل 
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توفير يقدر ب 50,08 (لكل سيارة سيدان متوسطة الحجم). كما استطاعت هذه 

الأداة تقليل الوقت المستغرق في تخطيط خط السير لتوصيل الوجبات. كما تضمنت 

المزايا الأخرى زيادة رضا المتطوعين بالإضافة إلى زيادة فرص الاحتفاظ بهم. 

أسئلة للمناقشة: 

-١‏ ما هي التحديات المتعلقة بتوصيل الوجبة التي واجهت 
Metro Meals on Wheels Treasure Valley related‏ قبل اعتماد lI‏ 
المستندة إلى جدول البيانات؟ 

- وضح تصميم نموذج يستند إلى جدول البيانات. 

؟- ما هي الفوائد غير الملموسة التي حصلت عليها 5واءء11 مه Metro Meals‏ 
بسبب استخدام نموذج يستند إلى 3Excel‏ 


Source: Adapted from Manikas, A. S., Kroes, J. R., & Gattiker, T. E. (2016). Metro 
Meals on Wheels Treasure Valley employs a low- cost routing tool to improve 
deliveries. Interfaces, 46(2), 154167-. 


تنطوي المميزات المهمة الأخرى لجدول البيانات على تحليلات ”ماذا - لو“ والبحث عن 
الهدف. بالإضافة إلى إدارة البيانات» وقابلية البرمجة (أي وحدات الماكرو). وهكن بسهولة تغيير 
قيمة الخلية والاطلاع فورًا على النتيجة. باستخدام جدول البيانات. كما يتم تنفيذ البحث عن 
الهدف من خلال الإشارة إلى خلية الهدف والقيمة المطلوبة والخلية المتغيرة. ويمكن تنفيذ إدارة 
قاعدة بيانات واسعة مع مجموعات بيانات صغيرةء أو أجزاء من قاعدة بيانات يمكن استيرادها 
للتحليل (والذي هو في الأساس كيفية عمل 014۶ مع مكعبات البيانات متعددة الأبعاد. وفي 
الواقع» فإن معظم أنظمة OLAP‏ لديها الشكل والمظهر من برامج جداول البيانات المتقدمة بعد 
تنزيل البيانات)» وتقوم قوالب ووحدات الماكرو والأدوات الأخرى بتعزيز إنتاجية بناء 255. 

ونظرًا لأن حزم جداول البيانات تقرأ وتكتب بنى ملفات شائعة وتتفاعل بسهولة مع قواعد 
البيانات والأدوات الأخرى؛ فإن معظمها يوفر تكاملًا سلسًا إلى حد ما. وتُعد مايكروسوفت إكسل 
هي حزمة جدول البيانات الأكثر انتشارًا. وفي الشكل (5-"). نقوم بعرض نموذج حساب قرض 
بسيط حيث تصف المربعات في جدول البيانات محتويات الخلاياء والتي تحتوي على صيغ؛ حيث 
يظهر تغيير في معدل الفائدة في الخلية ۴۷ على الفور في الدفع الشهري في الخلية ۴۱۴. ومن 
الممكن ملاحظة النتائج وتحليلها على الفور. فإذا كنا بحاجة إلى دفعة شهرية محددةء فيمكننا 
استخدام البحث عن الهدف بغرض تحديد سعر فائدة مناسب أو مبلغ قرض. 
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الجدير بالذكر أن جدول الحسابات الموضح في الشكل (1-”) ثابت. وعلى الرغم من تأثير 
المشكلة على المقترض بمرور الوقت إلا أن النموذج يشير إلى أداء شهر واحد, والذي يتم تكراره. 
وعلى النقيضء فإن النموذج الحركي يمثل السلوك بمرور الوقت. كما تشير حسابات القروض في 
جدول البيانات الموضحة في الشكل (6-1) إلى تأثير الدفع المسبق على المبلغ الأصلي بمرور الوقت. 
وباستخدام مولدات رقمية عشوائية مدمجة لتطوير نماذج ال محاكاةء هكن دمج تحليل الخطر في 
جداول البيانات (انظر الفصل التالي). 
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شكل 5-: مثال نموذج لجداول 801 الإحصائية لحساب قرض بسيط مدفوعات شهرية 
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شكل 5-16: مثال نموذج ديناميكي لجداول بيانات 1:01 لحساب قرض بسيط مدفوعات شهرية 
وتأثيرات الدفع المسبق 
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ويتم الإبلاغ عن تطبيقات جداول البيانات للنماذج بانتظام. وفي القسم التالي سوف نتعلم 
كيفية استخدام نموذج تحسين يعتمد على جدول البيانات. 


أسئلة مراجعة على القسم 0-5: 

-١‏ ما هو جدول البيانات؟ 

؟- ماذا أضاف جدول البيانات؟ وكيف تساعد هذه الإضافة في إنشاء واستخدام 1055؟ 
g ål -Y‏ اذا يؤدي جدول البيانات إلى تطوير نظام 255 


7-1 تحسين البرمجة الرياضية: 

إن البرمجة الرياضية هي مجموعة من الأدوات التي صُممت من أجل المساعدة في حل 
المشاكل الإدارية والتي ينبغي أن يقوم فيها صانع القرار بتخصيص موارد نادرة بين الأنشطة 
المتنافسة من أجل تحسين هدف قابل للقياس. فعلى سبيل المثال» يعتبر توزيع وقت الماكينة 
(المورد) بين المنتجات المختلفة (الأنشطة) مشكلة تخصيص نموذجية. وتُعد البرمجة الخطية 
as] (LP)‏ ( 415 معروفة في عائلة أدوات التحسين والتي تسمى البرمجة الرياضية؛ حيث 
تكون كافة العلاقات بين المتغيرات خطية LP à‏ كما يتم استخدامه على نطاق واسع في نظام 
الترصد الدهوغرافي (انظر الحالة العملية 1-7). وتتميز نماذج البرمجة الخطية بأن لديها العديد 
من التطبيقات المهمة في الممارسة. وتتضمن هذه التطبيقات إدارة سلسلة التوريد, وقرارات 
مزج المنتجات, والتوجيه. وغير ذلك. ومن الممكن استخدام أشكال خاصة من النماذج لأجل 
تطبيقات محددة. فعلى سبيل المثال. تصف الحالة العملية (1-17) نموذج جدول البيانات الذي 
تم استخدامه لإنشاء جدول زمني للأطباء. 


حالة عملية 5-5 
مساعدة موذج البرمجة العددية المختلطة مركز جامعة تينيسي gh! (Tennessee)‏ 
في وضع جدول مواعيد الأطباء 
إن مؤسسة الأطفال حديثي الولادة الإقليمية Regional Neonatal Associates‏ ھي 
عبارة عن مجموعة تضم تسعة أطباء يعملون في وحدة العناية المركزة لحديثي الولادة 
(NICU)‏ $ المركز الطبي لجامعة تينيسي à (Tennessee)‏ نوکس (Knoxville) Lå‏ 
تينيسي (160265566). كما تخدم المجموعة أيضًا اثنتين من ا مستشفيات المحلية في 


co^‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات التوجيهية: التحسين والمحاكاة 


منطقة نوكس فيل (1201116) لأغراض الطوارئ. ولعدة سنوات» يقوم عضو واحد في 
ا مجموعة بوضع جدول مواعيد Gous LLU!‏ لعدة سنوات, بيد أنه مع إقتراب تقاعده, 
كانت هناك حاجة إلى نظام أكثر تلقائية لوضع جدول مواعيد الأطباء. وقد رغب الأطباء 
في أن يكون هذا النظام قادرًا على موازنة عبء العمل الخاص بهمء حيث م تستطع 
الجداول السابقة موازنة عبء العمل بينهم بشكل مناسب. وبالإضافة إلى ذلك. فإن 
الجدول الزمني يحتاج لضمان تواجد الأطباء ۲١‏ ساعة ۷ أيام في الأسبوع لتغطية وحدة 
العناية المركزة لحديثي الولادة 711017 من قبل الأطباء. وإذا أمكنء يقوم هذا النظام 
باستيعاب التفضيلات الفردية للأطباء لأنواع التناوب. ولمعالجة هذه المشكلة. قام 
الأطباء بالاتصال بكلية العلوم الإدارية في جامعة 54:25( (Tennessee)‏ 

وقد تميزت مشكلة جدولة مواعيد الأطباء إلى نوبات بأنها كانت تقوم على أساس 
قيود عبء العمل وخيارات نمط الحياة. وقد تمثلت الخطوة الأولى لحل مشكلة في 
الجدولة وهي تجميع النوبات وفقًا لأنواعها (ليلًا ونهارًا). أما الخطوة التالية فقد تمثلت 
في تحديد قيود المشكلة. ويحتاج النموذج لتغطية فترة تسعة أسابيع بتسعة أطباء 
مع اثنين من الأطباء يعملون طوال أيام الأسبوع وطبيب واحد لَيْلِي وفي عطلات نهاية 
الأمبوع. بالإضافة إلى ضرورة تعيين طبيب واحد فقط لتغطية ۲٤‏ ساعة يوميًا لسبعة 
أيام في الأسبوع للمستشفتين ال محليّين. كما تحتاج القيود الواضحة الأخرى أيضًا إلى النظر 
فيها. فعلى سبيل المثال» لا يمكن تكليف طبيب بوردية نهارية بعد قضائه لوردية ليلية. 

المنهجية / الحل: 

تم صياغة ا لمشكلة من خلال إنشاء نموذج تحسين عددي مختلط. وقد قسم 
النموذج الأول حجم العمل بين تسعة أطباء بالتساوي. غير أن هذا النموذج م يستطع 
أن يحدد عددًا متساويًا من النوبات الليلية والنهارية بين الأطباء. وقد نشأ عن ذلك 
مسألة التوزيع العادل. وبالإضافة إلى ذلكء فقد كان للأطباء آراء مختلفة حول عبء 
العمل المحدد. وقد أراد ستة أطباء وضع جدول زمني يتم فيه تعيين عددٍ متساو من 
النوبات النهارية والليلية لكل طبيب في الجدول الزمني الذي يستغرق تسعة à aola‏ 
حين يرغب الآخرون بوضع جدول زمني بناءً على تفضيل كل فرد من الأطباء للنوبات. 
ومن أجل ذلك تم تشكيل نموذج جديد يمكنه تلبية متطلبات كلا الفريقين من الأطباء 
وسّمي هذا النموذج بنموذج جدولة التفضيلات المختلطة (/11251). ومن أجل تلبية 
متطلبات ا مساواة للستة أطباء الذين رغبوا في ذلك. قام Ío gògail‏ بحساب حجم 
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العمل لمدة أسبوع واحد ثم قسمه ممدة تسعة أسابيع بالنسبة لهم. وبهذه الطريقةء 
استطاع تقسيم العمل بالتساوي بين جميع الأطباء الستة. ثم قام بتقسيم عبء العمل 
للثلاثة أطباء المتبقين في الجدول الزمني لمدة تسعة أسابيع وفقًا لتفضيلاتهم. ومن ثم 
قام الأطباء بمراجعة الجدول الزمني الناتج فوجدوه أكثر قبولا. 
النتائج / الفوائد: 
استطاعت طريقة جدولة التفضيلات المختلطة 1۲5M‏ أن تستوعب كلا من متطلبات 
المساواة ومتطلبات الأفضلية الفردية للأطباء. وبالإضافة إلى ذلك. فقد تمكّنت الجداول 
من هذا النموذج من تقديم أوقات راحة أفضل للأطباء مقارنةٌ بالجداول الزمنية السابقة, 
فضلًا عن إمكانية تلبية طلبات الإجازات في الجداول. كما يستطيع نموذج 110514 حل 
مشاكل الجدولة المشابهة التي تتطلب التفضيلات النسبية بين أنواع النوبات. 
وتستطيع بعض التقنيات من مثل نماذج البرمجة العددية المختلطة أن تقوم بإنشاء 
الجداول الى فضلًا عن قدرتها على المساعدة في العمليات. وقد تم استخدام هذه 
التقنيات في المؤسسات الكبيرة لفترة طويلة. والآن يمكن تنفيذ مثل هذه النماذج التحليلية 
التوضيحية في جداول البيانات وغيرها من البرامج المتاحة بسهولة. 
أسئلة للمناقشة: 
-١‏ ما هي المشكلة التي واجهت مؤسسة الأطفال حديثي الولادة الإقليمية؟ 
àS -Y‏ استطاع نموذج 1125234 تلبية جميع متطلبات الأطباء؟ 
Source: Adapted from Bowers, M. R., Noon, C. E., Wu, W., & Bass, J. K. (2016).‏ 
Neonatal physician scheduling at the University of Tennessee Medical Center.‏ 
Interfaces, 46(2), 168182-.‏ 
وعادةً ما تُظهر مشاكل توزيع البرمجة الخطية المميزات التالية: 
- هناك كمية محدودة من اموارد الاقتصادية متاحة للتخصيص. 
- تُستخدم الموارد في إنتاج المنتجات أو الخدمات. 
- يوجد طريقتان أو أكثر يمكن من خلالها استخدام اللوارد ويسمى كل منها حل أو برنامج. 
- ينتج عن كل نشاط (منتج أو خدمة) والذي يتم استخدام الموارد فيه» عائدًا على الشروط 
الخاصة بالهدف المعلن. 
bole -‏ ما يكون التخصيص مقيدًا بعدة قيود ومتطلبات» تسمى القيود. 
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ويعتمد نموذج تخصيص البرمجة الخطية على الافتراضات الاقتصادية العقلانية التالية: 
- يمكن مقارنة العوائد من التخصيصات المختلفة؛ بمعنى أنه يمكن قياسها بوحدة مشتركة (مثل: 
الدولارء والفائدة). 

- العائد من أي تخصيص يكون مستقلًا عن التوزيعات الأخرى. 
- إجمالي العائد هو مجموع العوائد الناتجة عن الأنشطة المختلفة. 
- جميع البيانات معروفة على وجه التأكد. 
- استخدام الموارد بطريقة أكثر اقتصادًا. 

وعادةً ما تتضمن مشالكل التخصيص عددًا كبيرآ من الحلول الممكنة. واعتمادًا على الافتراضات 
الأماسية؛ فإن عدد الحلول قد يكون لا نهائي وقد يكون محدودًا. وعادةٌ ما تنتج الحلول المختلفة 
مكافآت مختلفة. ومن بين الحلول المتاحة يوجد على الأقل حل واحد يعتبر هو الأفضلء بمعنى أن 
درجة تحقيق الأهداف المرتبطة به هي الأعلى (أي إن إجمالي المكافأة هو الحد الأقصى). وهذا ما 
يسمى الحل الأمثل» ويمكن العثور عليه باستخدام خوارزمية خاصة. 
نموذج البرمجة الخطية: 

يتكون كل نموذج برمجة خطية a LP‏ متغيرات القرار (والتي تكون قيمتها غير معروفة 
ويتم البحث عنها)» ودالة موضوعية (دالة حسابية خطية تربط متغيرات القرار بالهدفء كما 
تأخذ ا معايير اللازمة لتحقق الأهداف, وكيفية تحسينها)ء ومعاملات دالة الهدف (وحدة الربح أو 
معاملات التكلفة التي تشير إلى إسهام هدف وحدة واحدة من متغرر القرار)» بالإضافة إلى القيود 
(ا معبر عنها في شكل عدم مساواة خطية أو مساواة تحد من الموارد و / أو المتطلبات؛ والتي 
تقوم بربط المتغيرات من خلال العلاقات الخطية)» والقدرات (والتي تصف الحدود العليا وأحيانًا 
الحدود الدنيا حسب القيود والمتغيرات)» ومعاملات المدخلات / المخرجات (التقنية) (والتى تشير 
إلى استخدام الموارد من أجل متغير القرار). 1 

دعونا نتأمل هذا المثال: تحتاج شركة 181 التي تقوم بصنع أجهزة حاسب لأغراض خاصة 
إلى اتخاذ قرار بخصوص: كمْ عدد أجهزة الحاسب التي ينبغي إنتاجها الشهر المُقبل في مصنع 
بوسطن؟ حيث تدرس 2481 نوعين من أجهزة الحاسب: 00-7 والتي تتطلب ٠١‏ يوم من 
العمل و١٠٠٠٠5‏ للخاماتء CC-89‏ والتي تتطلب 02٠١‏ يوم عمل و٠٠٠,٥$1‏ للخامات. وتبلغ 
قيمة المساهمة الربحية لكل جهاز 00-7 65٠٠0٠-08‏ في حين تبلغ المساهمة الربحية لكل جهاز 
glos .$\Y, ++- CC-8‏ سعة 5*٠ gol‏ يوم عمل في الشهرء كما تبلغ اميزانية المادية ۸ 
مليون دولار شهريًا. ويتطلب التسويق إنتاج ٠٠١‏ وحدة من 00-7 على الأقل بالإضافة إلى ما لا 
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يقل عن ٠٠١‏ وحدة من 00-8 كل شهر. وتكمن المشكلة في زيادة أرباح الشركة إلى أقصى حد 
من خلال تحديد عدد وحدات 00-7 وعدد وحدات 00-8 التى ينبغى إنتاجها كل شهر. لاحظ 
أن هذا الأمر قد يستغرق شهورًا للحصول على بيانات مشكلة معينة في البيئة الواقعية, وأثناء 
جمع البيانات سيكشف صانع القرار بلا شك الحقائق حول كيفية هيكلة النموذج المطلوب حله. 
رؤية فنية :1-١‏ البرمجة الخطّية 
رها تكون البرمجة الخطية 1۶ هي نموذج التحسين الأكثر شهرة؛ حيث يتعامل هذا 
النموذج مع التخصيص الأمثل للموارد بين الأنشطة المتنافسة. وقد تم توضيح مشكلة 
التخصيص من خلال النموذج الموضح هناء 
وتكمن المشكلة في العثور على قيم متغيرات القرار س١‏ وس١‏ وغيرهاء بهدف وصول 
قيمة متغير النتيجة 7 إلى أقصى حد ممكنء مع مراعاة مجموعة من القيود الخطية التي 
تعبر عن كل من التقنية» وظروف السوقه بالإضافة إلى المتغيرات الأخرى التي لا هكن 
التحكم فيها. أما العلاقات الرياضية فهي كل المعادلات الخطية بالإضافة إلى التباين. 
ومن الناحية النظرية» فإن أي مشكلة تخصيص من هذا النوع لديها العديد من الحلول 
الممكنة التي لا حصر لها. فمن خلال استخدام إجراءات رياضية خاصةء يطبق منهج 
البرمجة الخطية 1۴ إجراء بحث فريد يتم تنفيذها بواسطة الحاسب حيث هكنه إيجاد 
أفضل حل (حلول) في غضون ثوانِ» فضلًا عن قدرته على توفير تحليل الحساسية التلقائي. 
النمذجة في البرمجة الخطّية ط.1 مثال: 
يمكن تطوير نموذج برمجة خطية <1 قياسي لمشكلة شركة ۲۲ التي ذكرناها آنقًا. وكما 
ناقشنا في الفكرة التقنية (1-7). فإن نموذج البرمجة الخطية 1۶ يحتوي على ثلاثة مكونات» وهي: 
متغيرات القرار» ومتغيرات النتائج والمتغيرات التي لا يمكن التحكم فيها (القيود). 
حيث تكون متغيرات القرار كما uda‏ 





X, — units of CC — 7 to be produced 
X; — units of CC — 8 to be produced 











ويكون متغير النتيجة كما يلي: 





Total profit — Z 
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والهدف هو الوصول بالربح الإجمالي إلى أقصى حد ممكن: 


Z-8,000X, + 12,0001 














وتكون المتغيرات (القيود) التي لا يمكن التحكم فيها كما يلي: 


Labor constraint: 300X, + 500X: = 200,000 (in days) 

















Budget constraint: 10,000X, + 15,0003 < 8,000,000 (in dollars) 
Marketing requirement for CC — 7: X, z 100 (in units) 
Marketing requirement for CC — 8: X; 2 200 (in units) 











ويلخص الشكل (0-5) هذه المعلومات. 


= 8,000x,+12,000%, 










X, = units of CC7 
X, = units of CC-8 


300X, + 500X, < 200,000 
10,000X, + 15,000X, < 8,000,000 


X, 2 10 
X, > 200 











شكل 0-5: نموذج رياضي مثال مزيج المنتج 

وبالإضافة إلى المكونات التي ذكرت سابقًاء فإن النموذج يحتوي أيضًا على مكون رابع خفي؛ حيث 
يحتوي كل نموذج برمجة خطية 1.7 على بعض المتغيرات الوسيطة الداخلية والتي لم تذكر بشكل صريح. 
فعندما يكون الجانب الأيسر أقل دقة من الجانب الأمنء فإن كلا من قيود العمل واطيزانية قد تسبب 
حدوث بعض الركود بهم. هذا الركود يتم تمثيله داخليًا عن طريق متغيرات الركود التي تشير إلى وجود 
موارد زائدة متاحة. أما عندما يكون الجانب الأيسر ذا دقة أكبر من الجانب الأمن فإن قيود متطلبات 
التسويق قد يكون لدى كل منها بعض الفائضء ويتم تمثيل هذا الفائض داخليًا بواسطة المتغيرات 
الفائضة مما يدل على وجود بعض المساحة التي تتيح ضبط الجوانب اليمنى من هذه القيود. وعد كل 
من متغيرات الركود والفوائض متوسطة. كما أنها قد تكون ذات قيمة كبيرة لصانع القرار نظرًا لاستخدام 
طرق حل النماذج الخطية 1.2 لها في وضع مَعْلَمات الحساسية لتحليلات ”ماذا - لو“ الاقتصادية. 
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ويحتوي نموذج المزيج التسويقي على عدد لا نهائي من الحلول الممكنة. فإذا افترضنا أن خطة 
الإنتاج لا تقتصر على الأعداد الصحيحة - وهو افتراض معقول في خطة الإنتاج الشهرية - فإننا نريد 
حلا يصل بإجمالي الربح إلى أقصى حد ممكنء ألا وهو الحل الأمثل. ولحسن الحظ يظهر Excel gab,‏ 
مع الأداة الإضافية 501785: والتي يمكنها الحصول بسهولة على الحل الأمثل (الأفضل) لهذه المشكلة. 
وعلى الرغم من نقل موقع الوظيفة الإضافية :50176 من أحد الإصدارات إلى إصدار آخرء غير أنه 
مازال متاخًا كوظيفة إضافية مجانيةء ويمكنك البحث عنه ضمن علامات تبويب البيانات وعلى شريط 
التحليل. فإنه بمكن تفعيله من خلال الانتقال إلى قائمة الخيارات في 1081 وتحديد الوظائف الإضافية. 

ونقوم بإدخال هذه البيانات مباشرة في جدول بيانات 101 ثم Solver hàs de Jas‏ 
ومن ثم نقوم بتحديد الهدف (من خلال وضع الخلية المستهدفة تساوي الحد الأقصى). بالإضافة إلى 
متغيرات القرار (عن طريق الإعداد بواسطة تغبير الخلايا). والقيود (من خلال التأكد من أن إجمالي 
العناصر المستهلكة أقل من أو يساوي الصفَّين الأوّلين ويكون أكبر من أو يساوي كلا الصفين الثالث 
والرابع). وتشكل كل من الخلايا 7© و107 خلايا متغير القرار. وبعد تشغيل الوظيفة الإضافية :5017 
سيتم ملء النتائج في هذه الخلايا؛ حيث 137 هي الخلية المستهدفة» والتي تعد أيضًا المتغير الناتج» كما 
أنها تمثل منتجًا من خلايا متغير القرار ومعاملات الربح لكل وحدة (في الخلايا 08 و108). لاحظ أنه تم 
قسمة جميع الأرقام على ٠٠٠١‏ لجعل كتابتها أسهل (باستثناء متغيرات القرار). وتصف الصفوف من 
؟ إلى ١١‏ قيود المشكلة: القيود على قدرة اليد العاملة» وعلى الميزانية» بالإضافة إلى القيود على الحد 
الأدنى المطلوب لإنتاج المنتجين ,15 و يكا. ويحدد كلا العمودين © و2 معاملات هذه القيود. وينطوي 
العمود 1 على الصيغ التي تضاعف متغيرات القرار (خلايا 7© و17) مع معاملات كل منهما في كل 
صف. أما القيمة الجانبية لهذه القيود فيحددها العمود 5. ولتطوير مضاعفات الصفوف والأعمدة 
بسهولة» فإنه يمكن استخدام إمكانيات مصفوفة إكسل (على (SUMPRODUCT illo JUU Juw‏ 
وبعد إعداد حسابات النموذج في 101 فإن هذا هو الوقت المناسب لاستدعاء الوظيفة الإضافية 
-Solver‏ $2595( النقر فوق الوظيفة الإضافية ل 501761 (مرة أخرى ضمن مجموعة Q^ Analysis‏ 
علامة تبويب البيانات) إلى فتح مربع حوار (إطار) يتيح لك تحديد الخلايا أو النطاقات التي تحدد 
خلية دالة الهدف ومتغيرات القرار / التغيير (الخلايا) والقيود. كما نقوم أيضًا باختيار طريقة الحل من 
الاختيارات (عادةً الإرمجة الخطية البسيطة (LP‏ ومن ثم نقوم بحل المشكلة. وبعد ذلك نقوم باختيار 
التقارير الثلاثة - الإجابة والحساسية والقيود - للحصول على الحل الأمثل من 85.066.667 = الربح» 
0 = ر 333.33 - ,36 كمأ يتضح من الشكل )1-7( حيث تنتج ŠW Solver‏ تقارير مفيدة حول 
الحل. كنك القيام بتجربتها. وقد أصبح الآن:50176 ذا قدرة على حل مشاكل البرمجة غير الخطية 
ومشاكل البرمجة الصحيحة باستخدام أساليب الحل الأخرى المتوفرة به. 


ow‏ ذكاء الأعمال والتحليلات وعلم البيانات. منظور إداري 
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شكل "-5: مثال لحل Solver‏ من [»ع<8 لمزيج المنتجات 
وفيما يلي مثال لتوضيح مدى قوة نمذجة جداول بيانات دعم القرارء وقد تم وضع هذا المثال 
من قبل البروفيسور 58711502 1161 من جامعة أوكلاهوما الحكومية. 
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شكل 5-/!: مثال لبيانات توزيع موارد الانتخابات 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


الفصل السادس 


حيث يصف الجدول الوارد في الشكل (5-/) بعض البيانات الافتراضية وسمات تسع «ولايات 
متقلبة» لانتخابات عام .٠١15‏ حيث تشمل سمات التسع ولايات مَن كان عددهم من الأصوات 
الانتخابيةء واثنتين من الواصفات الإقليمية (لاحظ أن هناك ثلاث ولايات تصئّف على أنها ليست 
شمالية ولا جنوبية). فضلًا عن ”وظيفة التأثير“ المقدرة والتي تتعلق بزيادة دعم المرشح لكل 
وحدة من حملات الاستثمار المالي في تلك الحالة. فعلى سبيل المثال, ثبين دالة التأثير 51 أنه 
سيكون هناك زيادة إجمالية قدرها ٠١‏ وحدات في دعم الناخبين (تظل الوحدات العامة هنا كما 
هي عامة) بالنسبة لكل وحدة مالية مستثمرة في تلك الولايةء كما تتكون من زيادة في دعم الشباب 
بمقدار ثلاث وحدات» ودعم كبار السن من الرجال مقدار وحدة واحدة والنساء صغار السن 
والمسنات بمقدار ١‏ وحدات لكل منهم. 

وتضم الحملة ٠١٠١‏ وحدة مالية للاستثمار في الولايات التسع؛ حيث ينبغي ألا يقل نصيب كل 
ولاية من الاستثمار عن 0 من إجمالي الاستثمارات الكلية» كما ينبغي ألا يزيد عن XY0‏ من إجمالي 
الاستثمارات المستثمرة في أي من الولايات. ولا يلزم استثمار جميع الوحدات البالغ عددها ٠١6١‏ 
وحدة (ينبغي أن يتعامل النموذج الخاص بك مع هذا بشكل صحيح). 

أيضًاء فإن الحملة لديها بعض القيود الأخرى. ومن وجهة نظر الاستثمار المالي» فإنه ينبغي أن 
يكون لدى الولايات الغربية (إجمالًا) استثمارات في الحملات بمستوى لا يقل عن 5١‏ من إجمالي 
المستثّمر في الولايات الشرقية. أما من حيث الأشخاص المتأثرينء فإنه ينبغي أن يؤدي قرار تخصيص 
الاستثمارات المالية للولايات إلى مالا يقل عن 57٠١‏ من إجمالي المتأثرين. وبشكل عام: فإنه ينبغي 
أن يكون العدد الإجمالي للإناث المتأثرين أكبر من أو يساوي العدد الإجمالي للذكور المتأثرين» 
بالإضافة إلى أنه يجب أن يكون <٤٦‏ على الأقل من مجموع الأشخاص المتأثرين من «اممسنين». 

وتتمشل مهمتنا في إنشاء نموذج برمجة صحيح مناسب يحدد العدد الصحيح الأمثل (أي 
العدد الكامل) للوحدات المالية الخاصة بالولايات والتي ترفع من مجصوع منتجات وحدات 
التصويت الانتخابية» التي يتم استثمارها تبعًا للقيود الأخرى المذكورة آنقًا إلى أقصى حد ممكن. 
(وهكذاء وبشكل غير مباشرء فإن هذا النموذج يفضل الولايات التي تتمتع بعدد كبير من الأصوات 
الانتخابية). لاحظ أنه يجب أن تؤدي جميع القرارات الخاصة بالتخصيص في النموذج إلى قيم 
douno‏ حتى يستطيع موظفو الحملة التنفيذ بسهولة. 

واعتمادًا على الأسئلة التالية التي يجيبون عنها. يمكن تصنيف الجوانب BWI‏ الخاصة 
بالنماذج» وتتمثل هذه الأسئلة في: 


ovi‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


التحليلات التوجيهية: التحسين والمحاكاة 


Nevada lláy ما الذي نتحكم فيه؟ المبلغ المستثمر في الإعلانات عبر التسع ولايات»‎ -١ 
وفرجينيا‎ Ohio gslaglg Wisconsin (3. 235$593 dowa lsjls «Colorado وکولورادو‎ 
ونیو هامہشایر‎ Florida 15 5185 .North Carolina U.JsjlS 59 (JI 4$LaNb . Virginia 
WI OH9 JAg CO9 NV متغيرات القرار التسعة:‎ Labé والتي‎ «New Hampshire 
NH ونالل و1. بالإضافة إلى‎ «VA 

-١‏ ماذا نريد أن نحقق؟ نريد تحقيق أقصى زيادة ممكنة للعدد الإجمالي لمكسب الأصوات 
الانتخابية. فنحن على دراية بقيمة كل صوت انتخابي في كل ولاية Cua CEV)‏ يعادل هذا 
الصوت الانتخابي *877 الاستثمارات المجمعة للولايات التسع أي: 





[Max (ONV + 9CO + 61A + 10171 + 18OH + 13VA + 15NC + 29FL + 4NH)| 





ho -Y‏ الذي يقيدنا؟ 
وفيما يلي القيود كما ذُكرت في وصف المشكلة: 
( أ ) مالا يزيد عن ٠,٠٠١‏ وحدة مالية للاستثمار فيهاء أي: 
.NV + CO + IA + WI + OH + VA + NC + FL + NH < = 1,050‏ 
(ب) استثمار 0> على الأقل من الإجمالي في كل ولايةء أي: 





NV > = 0.05 (NV + CO + IA + WI + OH + VA + NC + FL + NH) 
CO > = 0.05 (NV + CO + IA + WI + OH + VA + NC + FL + NH) 
IA > = 0.05 (NV + CO + IA + WI + OH + VA + NC + FL + NHD 
WI > = 0.05 (NV + CO + IA + WI + OH + VA + NC + FL + NHD 
OH > =0.05 (NV + CO + IA + WI + OH + VA + NC + FL + NH) 
VA > = 0.05 (NV + CO + IA + WI + OH + VA + NC + FL + NH) 
NC > = 0.05 (NV + CO + IA + WI + OH + VA + NC + FL + NH) 
FL > = 0.05 (NV + CO + IA + WI + OH + VA + NC + FL + NH) 
NH > =0.05 (NV + CO + IA + WI + OH + VA + NC + FL + NH) 











-Excel plaiul Gb oe Gb öda guh وهكننا تنفيذ هذه القيود‎ 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري ow‏ 





الفصل السادس 


Y (g)‏ يزيد الاستثمار عن <۲١‏ من الإجمالي في كل ولاية. 


وكما هو الحال في (ب)» فإننا نحتاج مرة أخرى إلى تسع قيود فردية لأننا لا نعرف كم 


من ١,١0١‏ سوف نستثمر. كما يجب ol‏ تكون القيود بعبارات «عامة». 





NV <= 0.25 (NV + CO + IA + WI + OH + VA KNC + FL + NH) 
CO <= 0.25 (NV + CO IA + WI + OH KR + NC + FL + NED 
خآ‎ >- 03 ov +o ++ r4 QER +c ++ N 
WI <= por ع‎ + VA + NC + FL+ ND 


OH <= E a 
VA <= d. cer O EN 
NC«- 0.25 (NV + CO+ ® e + VA + NC + FL + NH) 
FL«- 025 0v + ge. eund ب‎ 


NH « 7025 (NV, qu. مر‎ e 





(د) يجب ألا تقل مستويات استثمار الولايات الغربية عن >1١‏ من مستويات الولايات الشرقية. 





West States = NNPCO + IA + WI 
East States = QH + VA + NC + FL + NH 


So, (NV + CO + IA + WD > = 0.60 (OH + VA + NC + FL + NH). Again we can 
-Excel يتم تنفيذ هذا القيد من خلال طرق متنوعة باستخدام‎ 
من مجموع الناسء ويكون كالتالي:‎ 917٠١ ثير مالا يقل عن‎ 





(1ONV + 7,5CO + 8IA + 10WI + 7.5OH + 7.5VA +10 NC + 8FL + 8 NH) » — 9,200 


29 
b Ca) 











F1- 6 women influenced, F2 — 3.5 women 
F3 7 3 women influenced 

F1 = 4 men influenced, F2 — 4 men 

F3 = 5 men influenced 











ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


(9) أن يكون تأثير عدد الإناث على الأقل مثل الذكورء مما يتطلب انتقال وظائف التأثير. 


OA 


التحليلات التوجيهية: التحسين والمحاكاة 


فإذا كان إنجاز الإناث > - الذكورء فإنتا نحصل على: 





(NV + 3.5CO + 31A + 6WI + 3.5OH + 3.5VA + GNC + 3FL + 3N) > = 
(4NV + 4CO + SIA + 4W1 + 40H + 4VA + 4NC + SFL + SNH) 











وكما هو الحال من قبلء فإنه يمكننا تنفيذ ذلك في 1ع©<8 بطريقتين مختلفتين. 
( ز) ينبغي ألا تقل نسبة المسنين عن 67* من المجموع الكلي للأشخاص. 
وقد كان جميع الأشخاص المتأثرين على الجانب الأيسر من القيد (©). ولذلك فإن 
المسنين المتأثرين سوف يكونون كالتالي: 










(4NV + 3.500 + 451A + 4WI + 3.50H + 3.5VA + ANC + 4.5FL + 4.5NH) 
This would be set >= 0.46° the left-hand side of int (e). (10NV + 7500+ 
BIA + 10W01 + 7508 175A 10NC + 8FL + BO) which would give a right- 
side of XN 

(0.46NV - 3.45CO -- 3.681A + 4691+ e + 3.45VA + 4.6NC + 3.68FL + 
3,68NH) 





هذا هو القيد الأخير إلى جانب فرض أن تكون جميع المتغيرات أعدادًا صحيحة. 
وقد تسم ذكر كل شيء في الشروط الجبرية» وسيكون لهذا النموذج الصحيح من البرمجة 5 
متغيرات قرار و٤۲‏ قيدًا (قيد واحد للمتطلبات الصحيحة). 


التنفيذ: 


سيكون أحد المناهج صارمًا في تنفيذ النموذج «النموذج القياسي». أو نموذج شكل الصف» 
حيث تتم كتابة جميع القيود بمتغيرات القرار على الجانب الأيسرء وتتم كتابة رقم على الجانب 
الأمن. ويوضح الشكل (86-5) مثل هذا التنفيذء بالإضافة إلى أنه يعرض النموذج الذي تم حله. 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري ow‏ 


الفصل السادس 
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شكل A-1‏ موذج لتوزيع موارد الانتخابات - إصدار قياسي 
ويمكننا بدلا من ذلك استخدام جدول البيانات لحساب أجزاء مختلفة من النموذج بطريقة 
al o JS‏ وكذلك تنفيذ القيود المتكررة (5) و() بشكل فريد, بالإضافة إلى الحصول على جدول 
بيانات أكثر اختصارًا (غير أنها ليست واضحة). وهذا واضح في الشكل (9-5). 
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شكل 4-5: معادلة مضغوطة لتوزيع موارد الانتخابات 


ov.‏ ذكاء الأعمال والتحليلات وعلم البيانات. منظور إداري 


التحليلات التوجيهية: التحسين والمحاكاة 


كما يمكن أيضًا تحديد نماذج البرمجة الخطية «.1 (وتخصصاتها وتعميماتها) مباشرةً في عدد من 
أنظمة النمذجة الأخرى سهلة الاستخدام. ومن أشهر هذه النماذج: نموذج Lindo 52245 Lindo guid‏ 
(Systems, Inc., lindo.com; demos are available) Lingo‏ حيث 0م11 هو موذج برمجة خطية 
۳ كما أنه نظام برمجة صحيح. ويتم تحديد النماذج في الأساس بالطريقة ذاتها التي يتم تحديدها بها 
جيريًا. وقد استندت الشركة على نجاح ليندو 1000آ في Lingo gri åè poh‏ وهي لغة النمذجة 
التي تنطوي على محسن ليندو 11١٥‏ القوي والملحقات لحل المشاكل غير الخطية. وهناك العديد من 
لغات النمذحة الأخرى المتوفرة مثل: AMPL‏ و41311/15, XPRESS 3 MPL (Jl dàLayb‏ وغيرها. 

ومن خلال مجموعة متنوعة من أساليب البرمجة الرياضية: هكن حل نماذج التحسين الأكثر 
شيوعًاء وتتضمن هذه الأساليب ما يلي: 


- التكليف (أفضل مطابقة للأهداف). - البرمجة الحركية.2 - برمجة الأهداف. 


- الاستثمار (زيادة معدل العائد). - البرمجة الخطية والصحيحة. 
- نماذج الشبكة للتخطيط والجدولة. - البرمجة غير الخطية. 
- الاستبدال (وضع ميزانية رأس المال). - النقل (تقليل تكلفة الشحنات). 


- نماذج المخزون البسيط (مثل: كمية الطلب الاقتصادية). 


أسئلة مراجعة على القسم 5-5: 

LP اذكر مع التوضيح الافتراضات المتضمنة في البرمجة الخطية‎ -١ 
اذكر مع التوضيح خصائص البرمجة الخطية.‎ -١ 

*- قم بوصف مشكلة التخصيص. 


۷-١‏ الأهداف المتعددةء وتحليل الحساسيةء وتحليل «ماذا - لو»» والبحث عن الهدف: 

تنطوي الكثير من حالات اتخاذ القرار إن مم يكن معظمهاء على التلاعب بين الأهداف المتنافسة 
والبدائل. وبالإضافة إلى ذلك فإن هناك عدم تأكد بدرجة كبيرة حول الافتراضات والتنبؤات 
المستخدمة في بناء نموذج التحليلات التوجيهية. وتقر الفقرات التالية ببساطة أنه يتم معالجتها 
أيضًا في برامج وتقنيات التحليلات التوجيهية. كما أن تغطية هذه التقنيات عادةً ما تكون شائعة 
في الدورات التحليلية التوضيحية أو بحوث العمليات / العلوم الإدارية. 
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الأهداف المتعددة: 

يتم تحليل القرارات الإدارية بهدف التقييم قدر الإمكانء لمدى مساعدة كل بديل للمديرين 
على التقدم نحو أهدافهم. وللأسفء فإن تقييم المشاكل الإدارية نادرًا ما يتم بهدف واحد بسيطء 
مثل: تعظيم الربح. وتعد نظم إدارة اليوم معقدة بدرجة كبيرة» ونادرًا ما تجد أحد هذه الأنظمة 
لديها هدف واحد فقطء حيث يرغب المديرون بدلا من ذلك في تحقيق أهداف متزامنة في وقت 
واحد. والتي قد تتعارض مع بعضها البعض. الجدير بالذكر أن أصحاب المصلحة المختلفة تكون 
لديهم أهداف مختلفة. لذلكء فإنه غالبا ما يكون من الضروري تحليل كل بديل في ضوء تحديد 
كل هدف من الأهداف المتعددة (انظر 2001 Koksalan & Zionts,‏ 

وعلى سبيل المثالء فلنعتبر أن هناك شركة تحقق أرباحًاء فإنه بالإضافة إلى هدف الشركة في 
تحقيق مكاسب مالية» فإن لديها أهدافًا أخرى ترغب في تحقيقها وهي النمو وتطوير منتجاتها 
وموظفيهاء وتوفير الأمن الوظيفي لعمالهاء وخدمة المجتمع. كما يرغب المديرون في إرضاء المساهمين 
وفي الوقت ذاته يرغبون في التمتع برواتب عالية وحسابات مصرفية.وبالإضافة إلى ذلكء فإن الموظفين 
يرغبون في زيادة أجورهم واستحقاقاتهم من الأرباح. وعند اتخاذ قرار - بخصوص مشروع استشماري 
على سبيل المثال - فإن بعض هذه الأهداف تكمل بعضها البعضء في حين يتعارض بعضها الآخر. 
وقد وصف وطعهع1 (2004) كيف تقوم عملية التحليل الهرمي JI Uo (AHP)‏ جنب مع البرمجة 
الصحيحة: بمعالجة عدة أهداف في تقييم استثمارات تقنية المعلومات (11). 

وتستند العديد من النماذج الكمية لنظرية القرار على مقارنة مقياس واحد للفعالية.وبشكل 
cele‏ فإن ذلك يُعد شكلًا من أشكال المنفعة بالنسبة لصانع القرار. «els‏ فإنه من الضروري 
عادةً تحويل مشكلة ذات أهداف متعددة إلى مشكلة قياس فعالية واحدة قبل مقارنة آثار 
الحلول. وتُعد هذه طريقة شائعة لمعالجة أهداف متعددة في نموذج 12. 

وهناك بعض الصعوبات التي قد تنشأ عند تحليل الأهداف المتعددة. وتتمثل في: 
- صعوبة الحصول عادةً على بيان صريح لأهداف المنظمة. 
- قد يقوم صانع القرار بتغيير الأهمية الخاصة بأهداف معينة مع مرور الوقت أو من أجل 

سيناريوهات القرار المختلفة. 
- النظر إلى الأهداف وا مناهج الفرعية بنظرة مختلفة على مستويات مختلفة من التنظيم وداخل 
الإدارات المختلفة. 

- الاستجابة للتغيرات في المنظمة وبيئتها مما يترتب عليه تغيير الأهداف. 
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- قد يصعب تحديد العلاقة بين البدائل ودورها في تحديد الأهداف. 
- حل المشاكل المعقدة من قبل مجموعات من صانعي القرارء لكل واحد منهم رؤية شخصية 
خاصة به في تناول المشكلة. 
- قيام المشاركين بتقييم الأهمية (الأولويات) الخاصة بمختلف الأهدافء بطريقة مختلفة. 
وعند العمل مع مثل هذه الحالات» فإن هناك عدة طرق هكن اس تخدامها لمعالجة الأهداف 
امتعددة وتتمثل أكثر هذه الطرق شيوعًا في: 
- نظرية ا منفعة. 
- برمجة الأهداف. 
- التعبير عن الأهداف كقيودء باستخدام LP‏ 
- نظام النقاط. 


تحليل الحساسية: 

يقوم منشئ النماذج بعمل تنبؤات وافتراضات تتعلق ببيانات المدخلات» والتي يتناول الكثير 
منها تقييم العقود الآجلة غير المؤكدة. وعندما يتم حل النموذج. فإن النتائج تعتمد على هذه 
البيانات. ويحاول تحليل الحساسية تقييم أثر التغيير في بيانات المدخلات أو المَعُلمات على الحل 
المقترح (أي: متغير النتيجة). 

ونظرًا لأن تحليل الحساسية يسمح با مرونة والتكيف مع الظروف المتغيرة ومتطلبات مختلف 
حالات اتخاذ القرار» كما أنه يوفر Gas‏ أفضل للنموذج ووضع صنع القرار الذي يحاول وصفه. 
ويسمح للمدير بإدخال البيانات لزيادة الثقة في النموذج. فإنه يُعد مُهِمًا للغاية في التحليلات 
التوجيهية. ويقوم تحليل الحساسية باختبار العلاقات مثل: 
- أثر التغيرات في المتغيرات الخارجية (الغير قابلة للسيطرة عليها) واللغلمات (Je parameters‏ 

متغير النتيجة (النتائج). 

- أثر عدم التأكد في تقدير المتغيرات الخارجية. 
- تأثيرات التفاعلات المستقلة المختلفة بين المتغيرات. 
- قوة القرارات في ظل الظروف المتغيرة. 

وتستخدم تحليلات الحساسية من أجل: 
- مراجعة النماذج لاستبعاد الحساسيات الكبيرة جدًاء 
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- إضافة تفاصيل حول المتغيرات أو السيناريوهات الحساسة. 

- الحصول على تقديرات أفضل للمتغيرات الخارجية الحساسة. 

- تغيير نظام العام الحقيقي للحد من الحساسيات الفعلية. 

- قبول واستخدام العام الحقيقي الحساس (وبالتالي سريع التآثر بالنقد)» مما يؤدي إلى المراقبة 
المستمرة والوثيقة للنتائج الفعلية. 

أما نوعا تحليلات الحساسية فهما يتمثلان في التلقائية. والتجربة والخطأً. 

- تحليل الحساسية التلقاي: يتم إجراء الحساسية التلقائي في تطبيقات نموذجية كمية قياسية 
مثل LP‏ وعلي سبيل المثال» فإن هذا التحليل يقوم بالإبلاغ عن النطاق الذي يمكن أن يختلف 
فيه متغير إدخال معين أو قيمة مَعْلمة (مثل: تكلفة الوحدة) دون أن يكون له أي تأثير 
خطير على الحل المقترح. وعادةً ما يقتصر تحليل الحساسية التلقائي على تغيير واحد في كل 
مرة: وليس لكل المتغيرات بل فقط لمتغيرات معينة. وعلى الرغم من ذلكء. فإن هذا التحليل 
قوي بسبب قدرته على إنشاء نطاقات وحدود بسرعة كبيرة (وبجهد حاسوبي إضافي sl‏ بدون 
أي جهد إضافي). ويقوم ©5117 وتقريبًا جميع حزم البرامج الأخرى مثل 1.1200 بتوفير تحليل 
الحساسية. وبالنظر في مثال شركة 241 الذي قدمناه فيما سبق. فإنه من الممكن استخدام 
تحليل الحساسية لتحديد ما إذا كان الجانب الأيمن من القيد التسويقى على 00-8 بواسطة 
وحدة واحدة فإن صافي الربح سيزيد بمقدار .1,700 8. وهذا التناقص إلى الصفر يكون 
صحيحًا بالنسبة إلى الجانب الأمن. كما يمكن إجراء تحليل إضافي كبير على طول هذه الخطوط. 

- تحليل الحساسية والكشف عن الأخطاء: من خلال نهج التجربة والخطأ البسيط يمكن تحديد 
تأثير التغييرات في أي متغير, أو في عدة متغيرات؛ حيث هكنك تغيير بعض بيانات الإدخال وحل 
المشكلة مرة أخرى. وبتكرار التغييرات عدة مرات» فإنه قد يتم اكتشاف حلول أفضل وأحسن. 
ومثل هذا الاختبار والذي يسهل تنفيذه عند استخدام برامج النمذجة اطمناسبةء مثل: برنامج 
Excel‏ له أسلوبان: تحليل ”ماذا - لو“ بالإضافة إلى البحث عن الهدف عهناء»5 .Goal‏ 


تحليل ”ماذا - لو“: 
وقد أنشئ تحليل ”ماذا - لو“ على أساس سؤال ماذا سيحدث للحل إذا تم تغيير متغير إدخال 
أو افتراض أو قيمة مَعْلمة؟ وفيما يلي بعض الأمثلة: 
- ماذا سيحدث لإجمالي تكلفة المخزون إذا ارتفعت تكلفة حفظ المخزون بنسبة 5/٠١‏ 


- ما هى حصة السوق إذا ارتفعت ميزانية الإعلان بنسبة 0/؟ 
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ويُعد طرح هذه الأنواع من الأسئلة على نموذج الحاسب والحصول على إجابات فورية أمرًا 
سهلًا بالنسبة للمديرينء إذا ما تعاملوا مع واجهة المستخدم المناسبة. وعلاوةٌ على ذلك» فإن 
المديرين يمكنهم إجراء العديد من الحالاتء وبالتالي تغيير النسبة المئوية» أو أي بيانات أخرى في 
السؤال» حسب رغبتهم. ويستطيع صانع القرار فعل كل ذلك بشكل مباشرء دون مبرمج حاسب. 

ويقدم الشكل )٠١-١(‏ مثالا لجدول بيانات عن سؤال ”ماذا - لو“ لمشكلة التدفق النقدي. 
فعندما يقوم المستخدم بتغيير الخلايا التي تحتوي على المبيعات الأولية (من ٠٠١‏ إلى AYE‏ 
ومعدل نمو المبيعات (من”” إلى ×٤‏ لكل ربع)» فإن البرنامج يقوم على الفور بإعادة حساب قيمة 
صافي الربح السنوي (من 5١77‏ إلى '41417). وقد كانت المبيعات الأولية في البداية .٠٠١‏ حيث نمت 
معدل ۴× لكل ربع» محققةً ربحًا صافيًا قدره /8110. حيث يؤدي تغيير خلية المبيعات الأولية إلى 
٠‏ بالإضافة إلى تغيير معدل نمو المبيعات إلى ٤‏ إلى رفع صافي الربح السنوي إلى 5141. ويُعد 








تحليل ”ماذا - لو" شائعًا في العديد من أنظمة القرار. ويتم منح المستخدمين الفرصة لتغيير 
إجاباتهم على بعض الأسئلة الخاصة بالنظام» والحصول على اقتراح مُعَذَّل. 

ex 
s 
6 )810 تقييم المبيعات الأولية (الحلية‎ 
7 Unk revenue $ 0 )811 ومعدل نمو المبيعات (الخلية‎ 
Hain $ es Apc لتقييم التقير فى الأرياح‎ 
20 | وماد لماعم‎ 
11 Selesgrowth rate مبيعات أولية بمقدار 100 بمعدل نمو ربع سنوى‎ 
12 127 بمفدار 395 يتنج جائى ربج نوی درو‎ 
13 Anal net prof n 120 المقارية مع حالة ماذا-لو تمبيعات أولية بمفدار‎ 
14 4% بمعدل نمو ريع سنوى قدره‎ 
15 
16 
9 
18 
19 
10 Seles 
21 Revenue 
22 Vereble cost 
23 Rnd cost 
24 Metprofk 
25 











شكل :٠١-5‏ نموذج لحالة ”ماذا - لو“ من خلال ورقة عمل 
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البحث عن الهدف :Goal Seeking‏ 


يقوم البحث عن الهدف 8مكآء56 021 بحساب قيم المدخلات اللازمة لتحقيق ا مستوى 
المطلوب من المخرجات (الهدف). ويمثل هذا النهج نهج الحل المتأخر. وفيما يلي بعض الأمثلة 
على البحث :Goal Seeking Sagl ge‏ 
- ما هي الميزانية السنوية للبحث والتطوير اللازمة لتحقيق معدل نمو سنوي بنسبة ۱0 بحلول عام ۲۰۱۸؟ 
- كم عدد الممرضات اللازمة لتقليل متوسط وقت الانتظار للمريض في غرفة الطوارئ إلى أقل من ٠١‏ دقائق؟ 

ويقدم الشكل )١١-5(‏ مثالًا على البحث عن الهدف «JEU Luew deò „Goal Seeking‏ 
معدل العائد الداخلي (IRR)‏ في نموذج التخطيط الاي ۴×٤‏ هو معدل الفائدة الذي ينتج قيمة 
صافية حالية )N۶۷(‏ صفر. وهكننا حساب صاف القيمة الحالية للاستثمارات المخطط لهاء من 
خلال النظر إلى تدفق العائدات السنوية في العمود ۴. كما مكنا تحديد معدل العائد الداخلي 
من خلال تطبيق البحث «Goal Seeking bugl je‏ حيث تكون N۲۷‏ صفرًا. أما الهدف المراد 
تحقيقه والذي يحدد معدل العائد الداخلي لهذا التدفق النقديء ها في ذلك الاستثمار؛ فهو أن 
تساوي القيمة الصافية الحالية 21577 صفرًا. وقد قمنا بتعيين خلية 7/557 إلى القيمة ٠‏ عن طريق 
تغيير خلية معدل الفائدة. وكان الجواب ٠05‏ الام /. 














شكل 11-5: تحليل البحث عن الهدف 


ovi‏ ذكاء الأعمال والتحليلات وعلم البيانات. منظور إداري 


التحليلات التوجيهية: التحسين والمحاكاة 


حساب نقطة تحقيق التعادل عن طريق استخدام البحث عن الهدف يمكاءء5 6021: 
as (ls‏ تطبيقًا هاما للاستهداف ودناء56 601. وهذا يتضمن قيمة متغيرات القرار (مثل: 
الكمية التي يُراد إنتاجها) التي تحقق ربحًا صفريًا. 

وقد يكون من الصعب إجراء تحليل الحساسية في العديد من برامج التطبيقات العامة: نظرًا لأن الروتين 
المكتوب مسبقًا لا بمثل عادةً سوى فرصة محدودة لطرح أسئلة ”ماذا - لو". وينبغي أن يكون تنفيذ كل 
من ”ماذا - لو“» والبحث Jya aÍ Goal Seeking Sag)! ge‏ في نظام الترصد الديموغرافي DSS)‏ 


أسئلة مراجعة على القسم 5-ا: 

-١‏ اذكر بعضًا من الصعوبات التي قد تظهر عند تحليل أهداف متعددة. 

۲- اذكر أسباب القيام بتحليل الحساسية. 

-Y‏ وضح اذا قد يستخدم أحد المديرين تحليل ”ماذا - لو“. 

.002[ وضح اذا قد يقوم المدير باستخدام البحث عن الهدف قصناءة5‎ -٤ 


۸-1 تحليل القرار باستخدام جداول القرار وأشجار القرار: 

بالنسبة لحالات القرار التي تنطوي على عدد محدود من البدائل والذي Sale‏ 
ما يكون عددًا غير كبين فإنه يتم تخطيطها باستخدام نهج يسمى تحليل القرار (انظر 
-(Arsham, 2006a,b; Decision Analysis Society, decision analysis. society. informs. org‏ 
حيث يتم باستخدام هذا النهج» سرد البدائل في جدول أو رسم بياني» مع مساهماتها المتوقعة 
للهدف (الأهداف) بالإضافة إلى احتمالية الحصول على المساهمة. ومن الممكن تقييم ذلك من 
أجل تحديد البديل الأفضل. 

ويمكن استخدام جداول القرارات أو أشجار القرار لصياغة ح الات الأهداف الفردية. كما يمكن 
وضع أهداف متعددة (معايير) مع العديد من التقنيات الأخرى» الموضحة لاحقًا في هذا الفصل. 


جداول القرارات: 


تقوم جداول القرارات بتنظيم المعلومات والمعرفة بش كل ملائم بطريقة منتظمة وجدولية 
بغرض إعدادها للتحليل. فعلى سبيل المثال» لنفترض أن شركة استثمار تقوم بدراسة الاستثمار في 
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بديل من البدائل الثلاثة: السندات. أو الأسهم. أو شهادات الإيداع (01(5)» فإن اهتمام الشركة 
سيكون مُنْصبًا على هدف واحد» ألا وهو زيادة العائد على الاستثمار إلى أقصى حد بعد عام 
واحد. فإذا اهتمت الشركة بأهداف أخرىء مثل السلامة أو السيولة» فإنه سيتم تصنيف المشكلة 
باعتبارها أحد مشاكل تحليل القرارات متعدد المعايير (انظر 2001 (Koksalan & Zionts,‏ 

ويعتمد العائد على حالة الاقتصاد في وقت ما في المستقبل (غالبًا ما تسمى حالة الطبيعة)ء والتي 
يمكن أن تكون في حالة نمو قويء أو ركود. أو تضخم. وفيما يلي العوائد السنوية التي يقدرها الخبراء: 
- إذا كان الاقتصاد ينمو بقوةء فإن عائد السندات سيكون 1١‏ والأسهم >٠١‏ والودائع لأجل 1,0/. 
- وفي حالة أن يكون الركود سائدًاء فإن عائد السندات سيكون 1 والأسهم ۳> والودائع لأجل 1,0×. 
- وإذا كان التضخم هو السائد, فإن عائد السندات سيكون > أما الأسهم فستحقق خسارة ۲ 

وستحقق الودائع لأجل عائد 1,0. 

وتكمن المشكلة في اختيار أفضل بديل للاستثمار. ومن المفترض أن تكون هذه البدائل منفصلة. وينبغي 
التعامل مع مجموعات مثل استثمار 0٠‏ في السندات و٠0‏ في الأسهم على اعتبار أنها بدائل جديدة. 

ويمكن النظر إلى مشكلة اتخاذ القرار في الاستثمار على اعتبار أنها لعبة بين شخصين Kelly, Jil)‏ 
2. فالمستثمر يصنع الاختيار (أي التحرك)» ومن ثم تحدث حالة طبيعية (يحدث التحرك). 
ويوضح الجدول (1-؟) مردود نموذج رياضي؛ حيث يشتمل الجدول على متغيرات القرار (البدائل)» 
ومتغيرات لا هكن السيطرة عليها (حالات الاقتصاد. مثل: البيئة)» ومتغيرات النتائج (العائد المتوقع» 
مثل: النتائج). وقد تم تصميم جميع النماذج في هذا القسم في إطار جدول بيانات. 

وإذا كان هناك مشكلة في اتخاذ القرار في ظل التأكد. فإننا سنعرف ماذا سيكون الاقتصاد كما 
يمكننا بسهولة اختيار أفضل استثمار. غير أن ذلك ليس هو الحالء ولذلك فإنه ينبغي علينا أخذ 
il>‏ عدم التأكد والخطر في الاعتبار. فمع عدم التأكد. فإننا لا نعرف احتمالات كل حالة من 
الطبيعة. ومع الخطرء سنفترض أننا نعرف الاحتمالات التي تحدث بها كل حالة من الطبيعة. 

معالجة عدم التأكد: هناك عدة طرق للتعامل مع عدم التأكد. فعلى سبيل المثال» فإن النهج 
التفاؤلي يفترض حدوث أفضل نتيجة ممكنة لكل بديل ومن ثم يختار أفضل الأفضل (أي: الأسهم). 
أما النهج التشاؤمي فإنه يفترض حدوث أسوأ نتيجة ممكنة لكل بديل ثم يختار الأفضل من بين النتائج 
(أي: شهادات الإيداع و02). وهناك نهج آخر يفترض ببساطة أن جميع حالات الطبيعة متساوية في 
ze VI‏ الات )انض Clemen & Reilly, 2000; Goodwin & Wright, 2000; Kontoghiorghes,‏ 
ga dolei asg (Rustem, & Siokos, 2002‏ حالة عدم التأكد فإن كل نهج من هذه المناهج 
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لديه مشاكل خطيرة عند تداوله لها. وينبغي على المحلل أن يحاول جمع ما يكفي من المعلومات 
قدر الإمكان» بحيث هكن التعامل مع المشكلة في إطار التأكد أو الخطر ا مفترضة. 

معالجة الخطر: تعد طريقة اختيار البديل بأكبر قيمة متوقعة هي الطريقة الأكثر شيوعًا لحل 
مشكلة تحليل الخطر. ولنفترض أن الخبراء يقدرون فرصة النمو القوي عند “0٠‏ وفرصة الركود 
عند 21٠‏ وفرصة التضخم عند ١‏ فإن جدول القرار عندئذ ستتم إعادة كتابته مع الاحتمالات 
المعروفة (انظر الجدول 2-5). كما يتم حساب القيمة عن طريق ضرب النتائج (أي: النواتج) 
حسب الاحتمالات الخاصة بها وإضافتها. فعلى سبيل المثالء الاستثمار في السندات يؤدي إلى عائد 
متوقع قدره عرق 2 )5( XY (50) c 1(,Y) e Y‏ 

وفي بعض الأحيان فإن هذا النهج قد يكون إستراتيجية خطرة نظرًا لأن فائدة كل نتيجة 
محتملة رها تكون مختلفة عن القيمة. وحتى في حالة وجود فرصة ضئيلة لخسارة كارثية» فإن 
القيمة المتوقعة قد تبدو معقولة, غير أن المستثمر قد يكون غير مستعد لتغطية الخسارة. فعلى 
سبيل المثال» لنفترض أن مستشارًا ماليًا يقدم لك استثمارًا «شبه مؤكد» بقيمة 5٠٠٠١‏ فإنه من 
الممكن أن يضاعف ذلك أموالك في يوم واحد. وعندئذ سيقول لك المستشار: ”حسناء هناك 
Jasal‏ 4444- بأنك ستضاعف أموالك. ولكن للأسف هناك احتمال ٠,٠٠٠0١‏ أنك ستكون مسؤولًا 
عن خسارة 5000.٠٠١‏ من حسابك". وتكون القيمة المتوقعة لهذا الاستثمار كالتالي: 
aeo Ss $eRe)-‏ تبراق - ($Y ee.‏ 4999 
V-‏ ,$05 - $3334 - 
SEA‏ = 

ومن الممكن أن تكون الخسارة المحتملة كارثية لأي مستثمر صغير ليس مليارديرًا. واعتمادًا 
على قدرة المستثمر على تغطية الخسارة, فإن للاستثمار أدوات مختلفة متوقعة. ولابد أن تنذكر 
جِيدًا أن ا مستثمر يتخذ القرار مرة واحدة فقط. 


جدول 5-",: نموذج لجدول حالة الطبيعة (متغيرات لا يمكن السيطرة عليها) 

















البديل النمو القوي (*) !)355 )4( التضخم (7) 

um M w السندات‎ 

Mane v 10,۰ esl 
Vo 1,0 Vo شهادات الإيداع و0‎ 
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أشجار القرار: 
تعد شجرة القرار تمثيلا بديلا لجدول القرار (وللاطلاع على أمثلةء انظر 
.)Mind Tools Ltd., mindtools. com‏ وتقوم شجرة القرار بإظهار علاقات المشكلة بيانيًا كما 
يمكنها التعامل مع حالات معقدة في نموذج مضغوط. ومع ذلك فإن شجرة القرارات قد تكون 
مُرهقة إذا كان هناك العديد من البدائل أو حالات الطبيعة. وتشتمل كل من (TreeAge‏ 
Software Inc, treeage.com) TreeAge Pro (Palisade Corp., palisade. Com)‏ 
PrecisionTrees‏ على أنظمة تحليل 52e‏ القرار القوية والبديهية والمتطورة. كما يُقدم هؤلاء 
الموردون أيضًا أمثلة ممتازة لأشجار القرار المستخدمة في الممارسة. ومن اللاحظ أن مصطلح 
شجرة القرار قد اس تُخدم لوصف نوعين مختلفين من النماذج والخوارزميات» في حين أنه في 
السياق الحالي تشير أشجار القرار إلى تحليل السيناريو. ومن جانب آخرء فإن بعض خوارزميات 
التصنيف في التحليل التنبؤي (انظر الفصلين 6 09) أيضًا خوارزميات شجرة القرار. 
وقد ورد في الجدول (5-1) حالة مبسطة للاستثمار لأهداف متعددة (وهي حالة اتخاذ قرار 
لتقييم البدائل بالعديد من الأهداف المتناقضة أحيانًا). وتتمثل الأهداف (المعايير) الثلاثة في كل من 
العائد والسلامة والسيولة. وهذه الحالة تم اتخاذ القرار فيها في ظل التأكد المفترض؛ بمعنى أنه يتم 
توقع نتيجة واحدة ممكنة لكل بديل؛ كما يمكن أخذ حالات الخطر أو عدم التأكد الأكثر تعقيدًا هي 
الأخرى في الاعتبار. وبعض النتائج تكون نوعية (مثل: منخفضة. عالية) بدلا من أن تكون رقمية. 


جدول 4-5: أهداف متعددة 














شهادات الإيداع و02 3,0 مرتفعة جدًا مرتفعة 














وطزيد من المعلومات حول تحليل القرار 5 Goodwin (2000) Reilly ; Clemen‏ ; )2000( 
Decision Analysis Society (informs.org/Community/ j|3Jl J, 45 zazexa |J] ةفضإلl «Wright‏ 
es .DAS)‏ الرغم من أن ذلك الأمر معقد للغاية» إلا أنه من الممكن تطبيق البرمجة الرياضية مباشرةٌ في 
حالات اتخاذ القرار تحت المجازفة. وسوف نناقش العديد من الطرق الأخرى لمعالجة الخطر في جزء لاحق 
من الكتاب» وهذا يتضمن المحاكاة وعوامل التأكد. بالإضافة إلى المنطق الغير واضح. 
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أسئلة مراجعة على القسم A-I‏ 

-١‏ ما هو جدول القرار؟ 

۲- ما هي شجرة القرار؟ 

-Y‏ كيف هكن استخدام شجرة القرار في صنع القرار؟ 

-٤‏ قم بوصف المقصود بأن يكون لديك أهداف متعددة. 


4-5 مقدمة في المحاكاة: 


نقدم في هذا القسم والقسم التالي مجموعةً من التقنيات التي تُستخدم لدعم القرار. وعلى 
نطاق واسع» فإن هذه الأساليب جميعها تقع تحت مظلة المحاكاة. وا محاكاة تمثل الواقع. وتعتبر 
ا محاكاة في أنظمة القرارء تقنية لإجراء تجارب (مثل: تحليلات ”ماذا - لو“) مع جهاز حاسب على 
نموذج من نظام الإدارة. وبا معنى الحرفي للكلمة فإن المحاكاة تعتبر طريقة وصفية أكثر من كونها 
إرشادية. كما أنه ليس هناك بحث تلقائي عن الحل الأمثل. وبدلًا من ذلك. فإن نموذج المحاكاة 
يصف أو يتنبا بخصائص نظام معين في ظل ظروف مختلفة؛ حيث يمكن اختيار أفضل البدائل 
المتعددة عندما يتم حساب قيم الخصائص. وللحصول على تقدير (وتغير) للتأثير الكلي لإجراءات 
d use‏ فإنه عادةٌ ما تقوم عملية المحاكاة بتكرار التجربة عدة مرات. وتعتبر محاكاة الحاسب 
مناسبة لعظم الحالاتء وعلى الرغم من ذلك فإن هناك بعض عمليات المحاكاة اليدوية المعروفة 
(مثل: قيام قسم شرطة المدينة بمحاكاة جدولة سيارتها الدورية مع عجلة لعبة الكرنفال). 

وتنطوي بعض حالات اتخاذ القرار الحقيقية في العادة. على بعض العشوائية. وبسبب تعامل 
العديد من مواقف القرار مع حالات شبه منظمة أو غير منظمة» فإن الواقع معقد. إلى الدرجة 
التي قد تجعل من الصعوبة تمثيله عن طريق التحسين أو نماذج أخرى» ولكن يمكن استخدام 
المحاكاة لمعالجته في كثير من الأحيان. وتُعد المحاكاة واحدة من أكثر طرق دعم القرار شيوعًا. 
وللاطلاع على مثال» انظر الحالة العملية (1-1). كما توضح الحالة العملية (7-/1) قيمة المحاكاة 
في بيئة لا يتوفر فيها الوقت الكافي لإجراء التجارب التحليلية. 


الخصائص الرئيسة للمحاكاة: 
Bote‏ ما تتضمن المحاكاة بناء نموذج للواقع من أجل المجال العملي. ومقارنةٌ بالنماذج التحليلية 
الأخرىء فإن نماذج المحاكاة قد تعاني من قلة عدد الافتراضات حول حالة القرار. وبالإضافة إلى 
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ذلك فإن المحاكاة að‏ تقنية لإجراء التجارب. ولذلكء فإنها تشتمل على اختبار قيم محددة للقرار 
أو المتغيرات التي لا يمكن السيطرة عليها في النموذج مع ملاحظة التأثير على متغيرات المخرجات. 

وأخيراه فإن المحاكاة لا تستخدم عادةً إلا عندما تكون المشكلة معقدة للغاية بحيث لا يمكن 
معالجتها باستخدام تقنيات التحسين الرقمي. ويقصد بالتعقيد في هذه الحالة إما عدم إمكانية 
صياغة المشكلة من أجل التحسين (فعلى سبيل المثال: بسبب الافتراضات الغير تطبيقية). أو أن 
الصيغة كبيرة جدًاء أو أن هناك الكثير من التفاعلات بين المتغيرات» أو أن المشكلة عشوائية في 
طبيعتها (أي: تعرض خطر أو عدم التأكد). 


حالة عملية 5-لا 
محاكاة آثار تدخلات الالتهاب الكبدي B‏ 

على الرغم من قيام الولايات المتحدة باستثمارات كبيرة في مجال الرعاية الصحية, 
غير أن هناك بعض المشاكل التي تبدو وكأنها تتحدى الحل. فعلى سبيل المثالء هناك 
نسبة كبيرة من السكان الآسيويين في الولايات المتحدة أكثر عرضة من غيرهم للإصابة 
بفيرس (8). وإذا م يتم علاج المرض بشكل فعالء فإن واحدًا من كل أربعة أشخاص 
مصابين بالعدوى إصابة مزمنة مهدد بالإصابة بسرطان الكبد أو تليف الكبد. فضلًا 
عن المشاكل الاجتماعية المرتبطة بالمرض (مثل العزل). وقد يكون التحكم في هذا 
المرض مكلقًا للغاية. وهناك عدد من المعايير للتحكم في ذلك المرضء وتتضمن الفحص, 
والتطعيم. وإجراءات العلاج. كما تتردد الحكومة في إنفاق الأموال على أي طريقة 
للتحكم ف المرض إلا إذا كانت فعالة من حيث التكلفة. كما أنه ليس هناك دليل على 
تحسن صحة ال مصابين بهذا المرض. وعلى الرغم من أن جميع معايير التحكم ليست 
مثالية لجميع الحالات» غير أن أفضل طريقة أو مجموعة طرق مكافحة هذا المرض غير 
معروفة حتى الآن. 

امنهجية / الحل: 

قام فريق متعدد التخصصات والذي تألف من أولئك الذين لديهم خلفيات طبية 
وإداريةء وهندسيةء بتطوير نموذج رياضي يستخدم أساليب أبحاث العمليات (018) والتي 
حددت التركيبة الصحيحة من إجراءات التحكم التي يجب استخدامها لمكافحة التهاب 
الكبد الوبائي 8 في سكان آسيا وجزر المحيط الهادئ. وعادةً ما يتم استخدام التجارب 
السريرية في المجال الطبي من أجل تحديد أفضل مسار للعمل في علاج الأمراض والوقاية 
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منها. ويتمثل تعقيد هذه الحالة في كون الالتهاب الكبدي 8 يستغرق فترة طويلة غير 
معتادة من الوقت حتى يحدث تقدم. وقد تم استخدام نماذج وطرق 0۸ بسبب التكلفة 
العالية التي تصاحب التجارب السريرية في هذه الحالة. وقد قدمت مجموعة من نماذج 
ماركوف 312107 ونماذج اتخاذ القرار طريقة أكثر فعالية من حيث التكلفة لتحديد 
تركيبة معايير الرقابة التي يجب استخدامها في أي وقت. ويساعد نموذج القرار في قياس 
الفوائد الاقتصادية والصحية لمختلف الإمكانات الخاصة بالفحص والعلاج والتنقيح. كما 
يُستخدم نموذج ماركوف 2181107 لنمذجة تطور الالتهاب الكبدي 8. وقد تم إنشاء 
النموذج الجديد استنادًا على المؤلفات والخبرات السابقة من أحد الباحثين بالإضافة إلى 
ما يُستمد من البيانات الفعلية الحالية للعدوى والعلاج. وقد قام صانعو السياسة ببناء 
النموذج الجديد باستخدام 8:1 21105016 لأنه سهل الاستخدام. 

النتائج / الفوائد: 

وقد تم تحليل النموذج الناتج مقارنةٌ ببرامج التحكم امموجودة في كل من الولايات 
المتحدة والصين. ففي الولايات المتحدة تم تطوير أربع إستراتيجيات ومقارنتها 
بالإستراتيجية الحالية. وتتمثل هذه الإستراتيجيات الأربع في: 

-١‏ يتم تطعيم جميع الأفراد. 

- يتم فحص الأفراد أولّا لتحديد ما إذا كانوا مصابين بعدوى مزمنة. فإذا كانت 
الإجابة بنعم» فعندئذ يتم التعامل معهم. 








"- يتم فحص الأفراد أولًا لتحديد ما إذا كان لديهم عدوى مزمنة. فإذا كان لديهم 
العدوى. يتم علاجهم. وبالإضافة إلى ذلك. يتم أيضًا فحص امرضى القرّبين للمصابين 
وتلقيحهم إذا لزم الأمر. 

4- يتم فحص الأفراد أولا لتحديد ما إذا كانوا مصابين بعدوى مزمنة أو بحاجة 
إلى تطعيم. فإذا كانوا مصابينء يتم علاجهم. وإذا كانوا بحاجة إلى التطعيم» يتم تطعيمهم. 

وقد أشارت نتائج المحاكاة إلى أن إجراء اختبارات إلدم لتحديد العدوى المزمنة 
وتطعيم الأشخاص المقربين من الناس المصابين تعد فعالة من حيث التكلفة. 

وفي الصين. ساعد النموذج على تصميم سياسة تطعيم للأطفال والمراهقين. وقد تمت 
مقارنة هذه السياسة مع مستويات التغطية الحالية للتطعيم ضد الالتهاب الكبدي 8. وقد 
انتهت إلى أنه عندما يتم تطعيم الأفراد دون سن *اعاماء فإن ذلك سيؤدي إلى تحسين 
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النتائج الصحية على المدى الطويل. وف الواقع. فإن هذه السياسة كانت فاعليتها من حيث 
التكلفة المالية أكثر من فاعلية السياسة الحالية بمكافحة امرض في مكان ما في وقت التقييم. 
أسئلة للمناقشة: 
-١‏ وضح ما تتميز به طرق 016 مثل المحاكاة على طرق التجارب السريرية في تحديد 
أفضل قياس للسيطرة على الالتهاب الكبدي 8. 
۲- ما هي الطرق التي يوفر بها القرار ونموذج ماركوف 2131107 وسائل فعالة من 
حيث التكلفة بلكافحة المرض؟ 
"- ناقش كيف تكون الخلفية متعددة التخصصات أصلا ف إيجاد حل للمشكلة 
الموضحة في القضية. ١‏ 
4- إلى جانب الرعاية الصحية: اذكر في أي مجال يمكن مثل هذا النهج النمطي أن 
يساعد في تقليل التكلفة. 
Source: Adapted from Hutton, D. W., Brandeau, M. L., & So, S. K. (2011). Doing good with‏ 
good OR: Supporting cost-effective Hepatitis B interventions. Interfaces, 41(3), 289300-.‏ 
مزايا المحاكاة: 
تُستخدم المحاكاة في نمذجة دعم القرار للأسباب التالية: 
- تعد هذه النظرية واضحة إلى Aa Ao‏ 
- من الممكن تحقيق قدر كبير من ضغط الوقتء مما يمنح المدير الشعور سريعًا ببعض التأثيرات 
للعديد من السياسات على المدى الطويل (من١‏ إلى ١٠سنوات).‏ 
- تُعد المحاكاة وصفية وليست معيارية. وهذا يسمح للمدير بطرح أسئلة ”ماذا - لو“. كما يمكن 
للمدير استخدام نهج التجربة والخطأ لحل المشاكلء كما يمكن أن يفعل ذلك بشكل أسرع 
وعلى حساب أقلء وبدقة أكبر بأقل bl‏ 
- كما يمكن للمدرب أن يقوم بالتجريب من أجل تحديد متغيرات القرار وأي أجزاء من البيئة 
مهمة بالفعل» ومع بدائل مختلفة. 
- يتطلب فوذج المحاكاة الدقيقة معرفة وثيقة با لمشكلةء مما يجبر مصمم النموذج على التفاعل 
باستمرار مع المدير. وهذا الأمر مطلوب من أجل تطوير أنظمة دعم القرار لأن كلا من المطور 
واطدير يكتسبان فهمًا أفضل للمشكلة. وللقرارات المحتملة المتاحة. 
- يتم تصميم النموذج من منظور المدير. 
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- يُصمم نموذج المحاكاة من أجل مشكلة معينة وغالبًا لا يمكن حل أي مشكلة أخرى. وبالتاليء لا 
يحتاج المدير إلى أي فهم عام؛ لأن كل مكون في النموذج يتوافق مع جزء من النظام الحقيقي. 

- يمكن للمحاكاة التعامل مع مجموعة كبيرة جدًا من أنواع المشاكلء مثل: المخزون» والموظفين» 
بالإضافة إلى الوظائف الإدارية عالية المستوى: مثل: التخطيط بعيد المدى. 

- من الممكن أن تتضمن امحاكاة بشكل عام التعقيدات الحقيقية للمشاكل؛ فالتبسيط ليس ضروريًا. 
وعلى سبيل المثالء قد تستخدم ا محاكاة توزيعات احتمالية حقيقية بدلا من توزيعات نظرية تقريبية. 

- تنتج المحاكاة العديد من مقاييس الأداء المهمة تلقائيًا. 

- غالبًا ما تكون ا محاكاة هي الأُسلوب الوحيد لنمذجة أنظمة دعم القرار والتي يمكنها التعامل 
بسهولة مع المشاكل غير المنظمة نسبيًا. 

- وتتوفر بعض حزم المحاكاة سهلة الاستخدام نسبيًًا (مثل: (Monte Carlo 5/jl$ Ciisa 8lSloxs‏ 
وهي بالإضافة إلى اشتمالها على حزم جداول البيانات )28 ): (GRISK‏ فإنها تتضمن أيضًا 
التأثير على برمجيات الرسم البيانيء وحزم جافا 278[ (وغيرها من تطورات الويب)» وسوف تتم 
مناقشة أنظمة المحاكاة التفاعلية المرئية في وقت قريب. 


عيوب المحاكاة: 
تتمثل العيوب الرئيسة للمحاكاة فيما يلي: 

- لا يمكن ضمان الحل الأمثلء لكن بشكل عام توجد حلول جيدة نسبيًا. 

- قد تكون عملية تصميم نموذج المحاكاة بطيئة ومكلفةء في حين أن أنظمة النمذجة الحديثة 
أسهل في الاستخدام من أي وقت مضى. 

- عادةً ما تكون الحلول والاستدلالات من دراسة المحاكاة غير قابلة للتحويل إلى مشاكل أخرى 
نظرًا لأن النموذج يتناول عوامل مشكلة فريدة من نوعها. 

- أحيانًا يكون من السهل شرح المحاكاة للمديرين في حين أن الطرق التحليلية غاليًا ما يتم تجاهلها. 

- في بعض الأحيان تتطلب برامج المحاكاة مهارات خاصة بسبب تعقيد طريقة الحل الرسمي. 


منهجية المحاكاة: 


تنطوي المحاكاة على وضع تموذج لنظام حقيقي وإجراء تجارب متكررة عليه. 
أما منهجية المحاكاة فإنها تتكون من الخطوات التاليةء كما هو موضح في الشكل :)١7-5(‏ 
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1- تحديد المشكلة: علينا دراسة وتصنيف اطمشكلة الواقعيةء ثم نحدد اذا يعد نهج المحاكاة 
مناسبًا. وهنا يتم التعامل مع حدود النظام والبيئة وغيرها من جوانب توضيح المشكلة. 

؟'- بناء نموذج المحاكاة: وتنطوي هذه الخطوة على تحديد التغيرات وعلاقاتها فضلًا عن جمع البيانات. 
وغالبًا ما يتم وصف العملية باستخدام مخطط انسيابيء ومن ثم تتم كتابة برنامج حاسب. 

۴- اختبار النموذج والتحقق من صحته: ينبغي أن يكون نموذج المحاكاة ممثلا للنظام الجاري 
دراسته بشكل صحيح. ولابد من اختبار ذلك والتحقق من صحته. 

-٤‏ تصميم التجربة: عند التأكد من صحة التموذج» يكون بذلك قد تم ت تصميم التجربة. ولابد من 
تحديد مدة تشغيل المحاكاة إذ إنها تُعد جزءًا من هذه الخطوة. وهناك نوعان من الأهداف 
المهمة والمتناقضة وهما: الدقة والتكلفة. ومن الحكمة أيضًا تحديد الحالات النموذجية (مثل: 
المتوسط والوسيط للمتغيرات العشوائية)» والحالات الأفضل (مثل: التكلفة المنخفضة. والربح 
المرتفع)» بالإضافة إلى أسوأ حالة من السيناريوهات (مثل: التكلفة المرتفعة» والإيرادات 
المنخفضة)؛ حيث يساعد ذلك في إنشاء نطاقات متغيرات القرار والبيئة التي تعمل فيها كما 
يساعد أيضًا في تصحيح نموذج المحاكاة. 

4- إجراء التجربة: ويقتضي إجراء التجربة مسائل تتراوح من إنشاء الأرقام العشوائية وصولًا إلى عرض النتائج. 

t‏ تقييم النتائج: ينبغي تفسير النتائج. بالإضافة إلى الأدوات الإحصائية القياسيةء كما يمكن أيضًا 
استخدام تحليلات الحساسية. 

۷ تنفيذ النتائج: إن تنفيذ المحاكاة مثله مثل أي تنفيذ آخرء فهو يتضمن نفس المشاكل التي 
يتضمنها أي تنفيذ آخر. «US mas‏ فإن فرص النجاح في المحاكاة تكون أفضل نظرًا لأن المدير 
Lo bole‏ يكون مشاركًا في عملية المحاكاة أكثر من النماذج الأخرى؛ حيث تؤدي المستويات 
العليا من المشاركة الإدارية بشكل عام إلى مستويات أعلى من نجاح التنفيذ. 
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شكل 17-5: عملية المحاكاة 
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وقد قدم كل من Gibson (2009) Banks‏ بعض النصائح المفيدة حول ممارسات المحاكاة؛ حيث 
قاموا على سبيل المثال» بسرد المشاكل السبعة التالية باعتبارها الأخطاء الشائعة التي يرتكبها مصممو 
تماذج المحاكاة. كما توفر القائمة, وإن لم تكن شاملة اتجاهات عامة لمحترفي العمل ممشاريع المحاكاة. 
- التركيز على النموذج أكثر من التركيز على اللمشكلة. 
- توفير تقديرات للنقطة. 
- عدم معرفة وقت التوقف. 
- إعداد تقرير بما يريد العميل سماعه وليس با تقوله نتائج النموذج. 
- عدم فهم الإحصاءات. 
- الخلط بين السبب والنتيجة. 
- الفشل في مطابقة الواقع. 

وفي مقال متابع, يتابع كل من علصة8 و(2009) 610500 بتقديم مبادئ توجيهية إضافية, 
ينبغي الرجوع إليها في هذا المقال: 
analytics-magazine.org/spring-2009/205-software-solutions-the-abcs-of-‏ 


simulationpractice.html. 


أنواع المحاكاة: 
وكما رأيناء فإنه عندما تكون الدراسات التجريبية وتجريب الأنظمة الحقيقية باهظة الثمن أو 
مستحيلة في بعض الأحيانء فإنه يتم استخدام المحاكاة والنمذجة؛ حيث تسمح لنا نماذج المحاكاة 
بالتحقق من مختلف السيناريوهات المثيرة للاهتمام قبل القيام بأي استثمار. وعمليات المحاكاة 
في الواقع» يتم فيها تعبين العمليات التي تحدث في العام الحقيقي في نموذج ا محاكاة حيث يتكون 
النموذج من علاقات» وبالتالي معادلات تقدم جميعًا عمليات العام الحقيقي. وتعتمد نتائج 
نموذج المحاكاة في هذه الحالة على مجموعة من اللَعُْلمات المعطاة للنموذج كمدخلات. 
وهناك العديد من نماذج المحاكاة مثل: محاكاة مونت كارلو Monte Carlo‏ أو نموذج 
الأحداث المنفصلة, أو نموذج العوامل القائمة, أو نموذج ديناميات النظام. ويُعد مستوى التجريد 
في المشكلة هو أحد العوامل التي تحدد نوع تقنية المحاكاة. وعادةً ما ُستخدم نماذج الأحداث 
المنفصلة والنماذج المعتمدة على العوامل طمستويات التجريد الوسطى أو ا منخفضة. وبالإضافة إلى 
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ذلك فإنه bole‏ ما يؤخذ في الاعتبار العناصر الفردية مثل الأشخاص والأجزاء والمنتجات في نماذج 
ا محاكاةء في حين أن ديناميات الأنظمة أكثر ملاءمة للتحليل الكلي. 
وسوف نقدم في القسم التالي» الأنواع الرئيسة من المحاكاة. وهي: المحاكاة الاحتماليةء وا محاكاة 
المعتمدة على الوقت والمستقلة عن الزمنء بالإضافة إلى المحاكاة المرئية. كما أن هناك العديد من 
تقنيات ال محاكاة الأخرى مثل نمذجة ديناميات النظام» والنماذج القائمة على الوكيل. وكما ذكرنا آنقاه 
فإن الهدف هنا هو تمكينك من إدراك إمكانات بعض هذه التقنيات بدلا من جعلك خبيرًا في استخدامها. 
المحاكاة الاحتمالية: في المحاكاة الاحتماليةء يكون هناك واحد أو أكثر من المتغيرات ا مستقلة 
(مثل: الطلب في مشكلة جرد) هي الاحتمالية. وهذه المتغيرات تتبع توزيعات احتمالية معينة, 
والتي قد تكون إما توزيعات منفصلة أو مستمرة: 
- التوزيعات المنفصلة: وتنطوي على حالة مع عدد محدود من الأحداث (أو المتغيرات) والتي قد 
تأخذ عددًا محدودًا فقط من القيم. 
- التوزيعات المستمرة: وهي حالات ذات عدد غير محدود من الأحداث الحتملة والتي تتبع 
وظائف الكثافةء مثل التوزيع الطبيعي. 
ويعرض الجدول (02-1) كلا نوعي التوزيعات. 
جدول 0-5: التوزيعات المنفصلة مقابل الاحتمالية المستمرة 
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المحاكاة المعتمدة على الوقت في مقابل المحاكاة المستقلة عن الوقت: يشير مصطلح الزمن 
المستقل إلى حالة لا يهم فيها معرفة وقت وقوع الحدث بالضبط. فعلى سبيل المثالء قد يكون 
لدينا علم أن الطلب على منتج معين عبارة عن ثلاث وحدات في اليوم غير أننا لا نهتم متى يتم 
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طلب العنصر خلال اليوم. وفي بعض الحالات» قد لا يكون الوقت عاملًا في المحاكاة على الإطلاق» 
كما هو الحال عند تصميم التحكم في المصانع بطريقة ثابتة. ومع ذلكء فإنه في مشاكل خط 
الانتظار التي تنطبق على التجارة الإلكترونيةء من الضروري معرفة الوقت الدقيق للوصول (لمعرفة 
ما إذا كان العميل سيضطر إلى الانتظار). وهذا الموقف ينطبق على الوقت المحدد. 


:Monte Carlo 3/j5 (iss 8651s. 
عادةً ما يتم استخدام أحد النوعين التاليين من المحاكاة الاحتمالية في معظم مشاكل القرارات‎ 
التجارية. وتّعد محاكاة مونت كارلو هى طريقة المحاكاة الأكثر شيوعًا لمشاكل قرارات العمل. وتبدأ‎ 
هذه الطريقة عادةً بتصميم نموذج للمشكلة القرار دون الحاجة إلى أخذ عدم التأكد في الاعتبار لأي‎ 
متغيرات» ثم ندرك أن هناك مَعّلمات أو متغيرات معينة تكون غير مؤكدة أو تتبع توزيع احتمالية‎ 
مفترض أو تقديري» ويعتمد هذا التقدير على تحليل البيانات السابقةء وعندئذ نبدأ بتشغيل تجارب‎ 
أخذ العينات. وتتكون تجارب أخذ العينات الجارية من إنشاء قيم عشوائية من المغلمات غير المؤكدة‎ 
ومن ثم قيم الحوسبة للمتغيرات التي تتأثر بمثل هذه المَعلمات أو المتغيرات؛ حيث تصل هذه التجارب‎ 
الخاصة بأخذ العينات بشكل أسامي إلى حل نفس النموذج مثات أو آلاف المرات. وبعد ذلك يمكننا‎ 
تحليل سلوك هذه المتغيرات التابعة أو متغيرات الأداء من خلال دراسة التوزيعات الإحصائية الخاصة‎ 
بهم. وقد استخدمت هذه الطريقة في محاكاة النظم الفيزيائية وكذلك نظم الأعمال. ويوفر موقع‎ 
sli (http://www.palisade.com/risk/monte carlo simulation.asp) Palisade.com 
وهي‎ RISK (5245 8l] تعليميًا عامًا وجيدًا لطريقة محاكاة مونت كارلو. كما يقوم الموقع بتسويق‎ 
عبارة عن برنامج محاكاة شائع يعتمد على جداول بيانات مونت كارلو. كما يوجد برنامج آخر شائع في‎ 
-Oracle as Oracle Crystal Ball às; Dl» 4355.5 ez» (Ul «Crystal Ball $a àzàJl ola 
دون استخدام‎ ۴×٥1 وبالطبع» فإنه يمكن أيضَّا إنشاء تجارب مونت كارلو وتشغيلها في جدول بیانات‎ 
أي برنامج إضافي مثل البرنامجَين اللدّين ذكرا آنفًا. غير أن هذه الأدوات تجعله أكثر ملاءمة لتشغيل‎ 
مثل هذه التجارب في النماذج القائمة على 5:5681. الجدير بالذكر أن نماذج محاكاة مونت كارلو قد‎ 
تم استخدامها في العديد من التطبيقات التجارية. ومن الأمثلة على ذلك استخدام شركة بروكتور‎ 
وجامبل (6210516 ع8 206161) لهذه النماذج لتحديد مخاطر الصرف الأجنبي؛ واستخدام شركة‎ 
تإللذآ للنموذج لتحديد القدرة النباتية المثلى؛ وكذلك شركة أبو ظبي للمياه والكهرباء والتي استخدمت‎ 
ن للتنبؤ بالطلب على المياه في أبو ظبي؛ بالإضافة إلى الآلاف من دراسات حالات واقعية أخرى.‎ 

ويشتمل كل موقع من مواقع شركات برامج المحاكاة على العديد من قصص النجاح. 
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محاكاة الحدث المنفصل: 
تشير محاكاة الحدث المنفصل إلى بناء نموذج لنظام يتم فيه دراسة التفاعل بين الكيانات 
المختلفة. وأبسط مثال على ذلك هو مثال المتجر الذي يتألف من خادم وعملاء. وهكننا تقدير 
متوسط أداء النظام» ووقت الانتظارء وعدد العملاء المنتظرين» وما إلى ذلكء من خلال نمذجة 
العملاء الذين يصلون إلى معدلات مختلفة» والخادم الذي يخدم بمعدلات مختلفة. ومثل هذه 
الأنظمة يتم النظر إليها باعتبارها مجموعات من العملاء وقوائم انتظارء وخوادم. كما يوجد 
الآلاف من التطبيقات الموثقة لنماذج محاكاة الأحداث المنفصلة في الهندسة. والأعمال التجارية, 
وما إلى ذلك. وقد كانت أدوات بناء نماذج محاكاة الحدث المنفصلة موجودة منذ فترة طويلة» غير 
أنها تطورت للاستفادة من التطورات في القدرات الرسومية لبناء وفهم نتائج مثل هذه النماذج 
للمحاكاة. وفي القسم التالي سوف نناقش هذه الطريقة الخاصة بالنمذجة. وتعرض الحالة العملية 
(6-7) مثالًا على استخدام هذه المحاكاة في تحليل تعقيدات سلسلة التوريد التي تستخدم محاكاة 
مرئية والتي سيتم وصفها في القسم التالي. 
حالة عملية AA‏ 
استخدام شركة كوزان (0059) المحاكاة من أجل تحسين سلسلة التوريد للطاقة 
1 هي مجموعة شركات مقرها البرازيل وتعمل على مستوى العاطء وأحد 
أنشطتها الرئيسة هي زراعة ومعالجة قصب السكر. وقد أصبح قصب السكر الآن 
مصدرًا رئيسا للإيثانولء فضلًا عن أنه المصدر الرئيس للسكرء كما أنه مكون رئيس في 
الطاقة المتجددة. وقد أصبح الإيثانول (Cosan 4554 D$ oU‏ بسبب تزايد الطلب 
على الطاقة المتجددة. حيث يقوم الإيثانول الآن بتشغيل مصفاتين بالإضافة إلى 18 
مصنع إنتاج» وملايين الهكتارات 1]47©5ء86 من مزارع قصب السكر. ووفقًا للبيانات 
الحديثة فقد عالجت الشركة أكثر من 64 مليون طن من قصب السكرء كما أنتجت أكثر 
من 1١,‏ مليار لتر من الإيثانول» بالإضافة إلى ٠,٠"‏ مليون طن من السكر. وكما يتبينء OB‏ 
عمليات هذا النطاق تؤدي إلى سلاسل التوريد المعقدة. ولذلك؛ فقد طُّلب من فريق 
الإمدادات تقديم توصيات إلى الإدارة العليا من أجل: 
- تحديد العدد الأمثل من الشاحنات المطلوبة في أسطول يُستخدم لنقل قصب 
السكر إلى معامل التصنيع من أجل الحفاظ على رأس المال. 
- تقديم اقتراح لكيفية زيادة قدرة قصب السكر الفعلية التي يتم إمداد مصانع السكر بها. 
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- تحديد مشاكل عنق الزجاجة المتعلقة بالإنتاج لوضع حلول لها من أجل تحسين 
تدفق قصب السكر. 

امنهجية / الحل: 

قام فريق الإمدادات بالعمل من خلال برمجيات 511310 ومن ثَّم قام الفريق ببناء 
تموذج محاكاة مركب لسلسلة توريد شركة 00588 فيما يتعلق بهذه المشاكل. وتبعًا 
للموجز الذي قدمته برمجيات Simio‏ فإنه: ”على مدار ثلاثة أشهرء قام المهندسون 
المستأجرون حديئًا بجمع البيانات المتعلقة بهذا المجال كما تلقوا تدريبًا عمليًا ومساعدة 
في النمذجة من "Paragon Consulting of San Palo‏ 

ولنمذجة العمليات الزراعية لتحليل رحلة ما بعد حصاد قصب السكر حتى يصل 
إلى مصانع الإنتاج. فقد شملت أهداف النموذج تفاصيل الأسطول الناقل لقصب السكر 
Unity Costa Pinto J| h)! ze‏ كما شملت أيصًا القدرة الفعلية لاستقبال مصانع 
سكر القصبء والاختناقات. بالإضافة إلى نقاط التحسين في تدفق C٣١‏ (قطع التنزيل) 
من قصب السكرء وهكذا. وتتمثل مَعْلمات النموذج فيما يلي: 

- متغيرات المدخلات: DV‏ 





- متغيرات الإنتاج: Y‏ 

- المتغيرات الإضافية: 'ا9. 

- كيانات متغيرة: „A‏ 

- جداول المدخلات: 19. 

- أيام المحاكاة: 76٠‏ (الموسم الأول). 

- عدد الكيانات: ٠١( ١7‏ أنواع مركبة حصاد لنقل قصب السكر). 

النتائج / الفوائد: 

وقد قدمت هذه التحليلات التي نتجت عن نماذج 512110 فكرة جيدة عن خطر 
التشغيل خلال فترة "6٠‏ يومًا بسبب الشكوك المختلفة. وقد تمكنت الشركة من اتخاذ 
قرارات أفضل وتوفير أكثر من 80٠٠,٠٠١‏ من هذه الجهود الخاصة بالنمذجة وحدها 
فقطء من خلال تحليل الاختناقات المختلفة وطرق التخفيف من هذه السيناريوهات. 

-١‏ ما نوع الاضطرابات في سلسلة التوريد التي يمكن أن تحدث في نقل قصب السكر 
من الحقل إلى مصانع الإنتاج لتطوير السكر والإيثانول؟ i‏ 
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-٣‏ ما هي الأنواع المتقدمة من التخطيط والتنبؤ التي قد تكون مفيدة في تخفيف 
مثل هذا الاضطراب؟ 

ما الذي هكن أن نتعلمه من هذه الحالة العملية؟ 

هذه القصة القصيرة للحالة العملية التي نحن بصددها توضح قيمة تطبيق المحاكاة 
على أحد المشاكل والتي قد يصعب معها بناء نموذج التحسين. ومن خلال دمج نموذج 
محاكاة الحدث المنفرد وا محاكاة التفاعلية المرئية (9715): يممكن تصور تأثير الانقطاعات 
à‏ سلسلة التوريد بسبب فشل الأسطول» والوقت غير المتوقع في هذا الوضع» وغير ذلك 
ومن e‏ التوصل إلى التصحيحات المخطط لها. 
Sources: Compiled from Wikipedia contributors, Cosan, Wikipedia, The Free‏ 
Encyclopedia, https://en.wikipedia.org/w/index.php?title-Cosan&oldid-713298536‏ 
(accessed July 10, 2016); Agricultural Operations Simulation Case Study: Cosan,‏ 
http://www.simio.com/case-studies/Cosan-agricultural-logistics-simulation-‏ 
software-case-study/agricultural-simulation-software- case-study-video-cosan.php,‏ 
(accessed July 2016); Cosan Case Study: Optimizing agricultural logistics operations,‏ 
http://www.simio.com/case-studies/Cosan-agricultural-logistics-simulation-‏ 

software-case-study/index.php, (accessed July 2016). 


أسئلة مراجعة على القسم 4-5: 

-١‏ اذكر خصائص المحاكاة. 

؟- اذكر مزايا وعيوب المحاكاة. 

-Y‏ اذكر مع الشرح خطوات منهجية المحاكاة. 
£- اذكر مع الشرح أنواع المحاكاة. 


٠١-1‏ المحاكاة التفاعلية المرئية: 


فيما يلي سنقوم بفحص الطرق التي تُبِين صورة صانع القرار أثناء اتخاذ القرار في العمل. فهو 
يعمل من خلال سيناريوهات لشتى البدائل. حيث تتغلب هذه الطرق القوية على بعض أوجه 
القصور في الطرق التقليدية كما تساعد على بناء الثقة في الحل الذي تم التوصل إليه نظرًا لإمكانية 
تصور هذه الطرق بشكل مباشر. 
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عيوب المحاكاة التقليدية: 

تُعد المحاكاة طريقة راسخة ومفيدة. بالإضافة إلى أنها وصفية, وتعتمد على الرياضيات 
لاكتساب نظرة ثاقبة في حالات اتخاذ القرار المعقدة. وعلى الرغم من كل ما ذكر, إلا أن المحاكاة 
عادةً لا تسمح لصانعي القرار برؤية كيفية تطور حل مشكلة معقدة (مضغوطة). بالإضافة إلى أن 
صانعي القرار لا يمكنهم التفاعل مع المحاكاة (والتي ستكون مفيدة لأغراض التدريب والتدريس). 
وبشكل عام» فإن المحاكاة تشير إلى النتائج الإحصائية في نهاية مجموعة من التجارب. وبالتاليه 
فإن صانعي القرار ليسوا جزءًا مكملًا في تطوير المحاكاة والتجريب» ولا هكن استخدام خبراتهم 
وحكمهم بشكل مباشر. فإذا كانت نتائج المحاكاة لا تتطابق مع حدس أو حكم صانع القرارء فإنه 
من الممكن حدوث فجوة ثقة في النتائج. 
المحاكاة التفاعلية المرئية: 

إن المحاكاة التفاعلية المرئية (7715)» والتي تُعرف أيضًا باسم النمذجة التفاعلية المرئية (/57713) 
وحل المشاكل التفاعلي المري» هي طريقة محاكاة تتيح لصانعي القرار رؤية ما يفعله النموذج 
وكيف يتفاعل مع القرارات التخذة حسب ما يتم صنعها. وقد استخدمت هذه التقنية بنجاح 
كبير في تحليل العمليات في عدة مجالات مثل سلسلة التوريد والرعاية الصحيةء حتى يتمكن 
go padé ubl‏ توظيف معرفته لتحديد وتجربة إستراتيجيات القرارات المختلفة أثناء التفاعل مع 
النموذج. ومن الممكن حدوث التعلم ا معزز حول مشكلة وتأثير البدائل التي تم اختبارها. 

ولعرض تأثير القرارات الإدارية المختلفة فإن ا محاكاة التفاعلية المرئية (۷18) تستخدم شاشات 
الرسوم ال متحركة للحاسب؛ حيث تختلف هذه الشاشات عن الرسومات العادية في أنها تنيح 
للمستخدم ضبط عملية صنع القرار ورؤية نتائج التدخل. ويّعد النموذج المرثي رسمًا بيانيًا يُستخدم 
باعتباره جزءًا لا يتجزأ من عملية صنع القرار أو حل المشاكلء وليس مجرد جهاز اتصال فقطء حيث 
يستجيب بعض الأشخاص للعروض الرسومية بشكل أفضل من غيرهم. كما يستطيع هذا النوع من 
التفاعل مساعدة المديرين في دراسة موقف اتخاذ القرار. 

ويمكن للمحاكاة التفاعلية المرئية (7715) أن توضح أنظمة ثابتة أو حركية؛ حيث تعرض النماذج 
الثابنة صورة مرئية لنتيجة بديل واحد في كل مرة. أما النماذج الحركية فإنها تعرض الأنظمة التي 
تتطور مع مرور الوقت» ويتم توضيح التطور عن طريق الرسوم المتحركة. وقد ارتبطت أحدث 
تقنيات المحاكاة المرئية بمفهوم الواقع الافتراضيء حيث يتم إنشاء عام اصطناعي لأغراض متعددة, 
من التدريب إلى الترفيه إلى عرض البيانات في مشهد اصطناعي. فعلى سبيل المثال» يقوم الجيش 
الأمريي باستخدام أنظمة 7715 حتى تتمكن القوات البرية من الإمام بالتضاريس أو المدينة من أجل 
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توجيه نفسها بسرعة كبيرة. كما يستخدم الطيارون ۷18 من أجل التعرف على الأهداف من خلال 
محاكاة عمليات الهجوم. وبالإضافة إلى ذلك» فإن برنامج 7715 قد يتضمن أيضًا إحداثيات 615. 
النماذج التفاعلية المرئية و1055: 

استخدمت النماذج التفاعلية المرئية في أنظمة دعم القرار في العديد من قرارات إدارة 
العمليات. وتتكون الطريقة من تحضير (مثل تحضير مضخة مياه) نموذج تفاعلي مرفي ملصنع (أو 
شركة) بوضعه الحالي» ومن تم يعمل النموذج بسرعة على الحاسب» مما يسمح للمديرين مراقبة 
احتمالات كيفية عمل المصنع في المستقبل. 

وخير مثال على النماذج التفاعلية ال مرئية (۷1۷) هو إدارة خط الانتظار (الطابور). وعادةٌ 
ما يقوم برنامج مثل أنظمة دعم القرار بحساب عدة مقاييس لأداء بدائل القرار المختلفة (مثل: 
وقت الانتظار في النظام). تتطلب مشاكل الطابور استخدام المحاكاة؛ حيث هكن للنماذج 
التفاعلية المرئية (VIM)‏ عند تشغيل المحاكاة عرض حجم الطابور أثناء تغييره كما يمكنها أيضًا 
تقديم إجابات بيانية حول ما إذا كانت الأسئلة تتعلق بالتغيرات التي تحدث في متغيرات الإدخال. 
وتقدم الحالة العملية (9-1) مثالًا لمحاكاة مرئية استُخدمت بغرض استكشاف تطبيقات تقنية 
تحديد gaal olse! $ (RFID) gohi Slas‏ 

كما هكن أيضًا دمج تقنيتي النماذج التفاعلية المرئية والذكاء الاصطناعي؛ حيث يضيف دمج 
كلا التقنيتين عدة قدرات تتراوح من القدرة على بناء الأنظمة بيانيًا إلى التعلم عن ديناميكيات 
النظام. فهذه الأنظمة - لاسيما تلك التي تم تطويرها للعسكرية وصناعة ألعاب الفيديو - لديها 
أساليب تفكير تجعلها قادرة على التصرف بمستوى ذكاء عالٍ نسبيًا في تفاعلاتها مع المستخدمين. 


حالة عملية 9-5 
تحسين قرارات جدولة محل العمل من خلال الترددات اللاسلكية («8711: التقييم 
القائم على المحاكاة 


يسعى مزود خدمات التصنيع الخاص بالمكونات البصرية والكهروميكانيكية المعقدة 
إلى اكتساب الكفاءة في قرار الجدولة الخاص بمحل عمله نظرًا لمعاناة عمليات المتجر 
الحالية من بعض المشاكل: 

- عدم وجود نظام للتسجيل في حالة وصول عناصر )W1۴( workin àlss.‏ فعليًا 
إلى محطات العمل أو عند مغادرتها محطات تشغيل العمل بالإضافة إلى مدة بقاء 
25 الفعلية في كل محطة عمل. 

- عدم قدرة النظام الحالي على مراقبة أو متابعة حركة كل ۷1۴ في خط الإنتاج بشكل فوري. 
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ونتيجة لذلكء فإن الشركة تواجه مش كلتين رئيستين في هذا الخط الإنتاجي» وهي: 
مشكلة التراكمات المرتفعة ومشكلة تكاليف ارتفاع العمل الإضافي لتلبية الطلب. 
وبالإضافة إلى ذلك. فإن المنبع لا يمكنه الاستجابة بسرعة كافية للحوادث غير المتوقعة 
مثل التغيرات في الطلب أو نقص المواد. كما أنه لا يمكنه مراجعة الجداول بطريقة فعالة 
من حيث التكلفة. وتقوم الشركة بدراسة تنفيذ ۸۴1۲ على خط الإنتاج. غير أنها 
بالرغم من ذلكء لا تعرف ما إذا كانت ستتحمل هذه النفقات الرئيسة من أجل إضافة 
رقائق ۸۴1۲ علی صنادیق الإنتاج» وتثبیت قارئات 2115 في جميع أنحاء خط الإنتاج» 
وبالتالي بكل تأكيد ستؤدي أنظمة معالجة هذه المعلومات إلى عدة مكاسب حقيقية. 
ولذلك؛ فإن هناك سؤالًا واحدًًا وهو لاستكشاف أي التغيرات الجديدة في جدولة الإنتاج 
التي من المحتمل أن تننج عن الاستثمار في بنية ۸۴1۲ التحتية. 

اممنهجية: 

نظرًا لأن استكشاف إدخال أي نظام جديد في نظام الإنتاج المادي من الممكن أن 
يكون مكلقًا للغاية أو حتى تخريبيًا فقد تم تطوير نموذج محاكاة للحدث منفصل 
لفحص كيف يستطيع التعقب (tracking)‏ والتتبع من خلال ۸۴1۲ أن يقوم بتسهيل 
أنشطة جدولة إنتاج ورشة العمل. وقد تم اقتراح قاعدة جدولة 7/85 تعتمد على الرؤية 
وتستخدم أنظمة التتبع الفورية لتعقب أجزاء ومكونات 10/1185: بالإضافة إلى المواد الخام 
في عمليات الورش (5080-1002). وقد تم تطبيق نهج المحاكاة من أجل فحص فائدة 
قاعدة 1785 مقابل قواعد الجدولة الكلاسيكية: الأسبق في بدايات وأقدم قواعد موعد 
الاستحقاق. وقد تم استخدام برامج 518110 لتطوير تموذج المحاكاة. وبرامج SIMIO‏ 
هي عبارة عن مجموعة من برامج محاكاة النماذج ثلاثية الأبعاد والتي تستخدم أسلوبًا 
Gago‏ نحو النمذجةء وقد تم استخدام هذه البرامج مؤخرًا في العديد من المجالات مثل 
المصانع وسلاسل التوريد والرعاية الصحية والمطارات وأنظمة الخدمات. 

ويعرض الشكل (1-5) لقطة شاشة من لوحة واجهة 518110 لهذا الخط الإنتاجي. 
حيث تتضمن تقديرات المَتٌلمات ا ممستخدمة للحالة الأولية في نموذج المحاكاة كلا من 
الطلبات والتوقعات ies I‏ بالإضافة إلى تدفق العمليةء وعدد محطات العملء وعدد 
مشغاي الطوابقء ووقت التشغيل في كل محطة عمل. وبالإضافة إلى ذلك فإنه يتم 
تقدير مَعْلَمات بعض بيانات الإدخال مثل وقت وضع علامات ۸۴1۲ أو وقت استرجاع 
ال معلومات. أو وقت تحديث النظام من خلال دراسة تجريبية ومن خبراء الموضوع. 
ويوضح الشكل )١5-5(‏ الرؤية العملية لنموذج المحاكاة حيث يتم تنفيذ أوامر محاكاة 
محددة وترميزها. كما يقدم كلا الشكلين (10-7) و(17-5) عرضًا للتقرير القياسي 
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الفصل السادس 


وتقرير الشبكة المحورية لنموذج المحاكاة. حيث يوفر كل من التقرير القياسي وشكل 
الشبكة المحورية طريقةً سريعة جدًا للعثور على نتائج إحصائية محددة الملتوسط. 
أو النسبة المئوية» أو الإجماليء أو الحد الآقصىء أو الحد الأدنى لقيم المتغيرات التي تم 
تعبينها والتقاطها كمخرج من نموذج المحاكاة. 

















شكل 16-5: عرض عملية نموذج المحاكاة 
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شكل 17-5: تقرير شبكة محورية من تشغيل SIMIO‏ 
النتائج: 
تشير نتائج المحاكاة إلى أن الأداء الذي ينتج عن قاعدة الجدولة المعتمدة على RFID‏ 
يُعد أفضل إذا ما قورن بقواعد الجدولة التقليدية فيما يتعلق بوقت المعالجة, ووقت 
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الفصل السادس 


الإنتاج» واستخدام ا مواردء والتراكم والإنتاجية. فإن الشركة يمكنها أخذ هذه المكاسب 
الإنتاجية ومن تم تقوم بتحليل التكلفة / الفائدة في اتخاذ قرارات الاستثمار النهائية. 





أسئلة للمناقشة: 

١-ما‏ هي الأساليب الأخرى التي يمكن اتخاذها لتحليل قرارات الاستثمار في الحالات 
التى تشبه هذه الحالة؟ 

۲- كيف هكن توفير الوقت قي حالة قدرة رقاقة ۸۴1۲ على معرفة الموقع الدقيق 
للمنتج قيد التشغيل؟ 

*- ابحث لتتعرف على تطبیقات آجهزة استشعار ۸۴10۲ في أماكن أخرى» مع 
توضيح أي منها تجده أكثر إثارة للاهتمام. 
Source: Based on Chongwatpol, J., & Sharda, R. (2013). RFID-enabled track and‏ 


traceability in job-shop scheduling environment. European Journal of Operational 


Research, 227(3), 453- 463, http://dx.doi.org/10.1016/j.ejor.2013.01.009. 

برامج المحاكاة: 

هناك المئات من حزم المحاكاة التي تتوفر لمجموعة من حالات اتخاذ القرار المتنوعة. حيث 
يتم تشغيل الكثير منها كنظم على شبكة الإنترنت. وتقوم Today‏ 0110/15 بنشر مراجعة دورية 
لبرامج اللحاكاة. وأحد هذه المراجعات الحديثة (اعتبارًا من أكتوبر eUs (Y-Yo‏ عبر orms-‏ 
(YVI gos È LYI Cg) today.org/surveys/Simulation/Simulation.html‏ وتتضمن 
حزم برامج الحاسب كلا من: 
«(Lumina Decision Systems, lumina.com) Analytica -‏ 


Oracle as Oracle Crystal Ball, Lö ġe OYI gU3 (, 5) Excel add-ins Crystal Ball - 


.(oracle.com 

.(Palisade Corp., palisade.com) (RISK - 

8512 4S (s )lo3 ms: 925 (soldby Rockwell Intl., arenasimulation.com) Arena - 
الأحداث المنفصلة.‎ 

Simi -‏ (i0.comصsi)»‏ وهو برنامج للمحاكاة التفاعلية المرئية (1715) سهل الاستخدام تم 
تطويره من قبل مطوري برنامج ه٣٠‏ الأصليين. وبالإضافة إلى ذلك فهناك: 


OSA‏ ذكاء الأعمال والتحليلات وعلم البيانات. منظور إداري 


التحليلات التوجيهية: التحسين والمحاكاة 


(extendsim.com) ExtendSim -‏ وھو برنامج محاكاة تفاعلية مرثیة (۷16) آخر متمیز کما 
أن له شهرة واسعة. 

- ۷۶[ وتمتلكه 5۸45 وهو عبارة عن حزمة برمجية تحليلية رسومية تنطوي أيضًا على المحاكاة كأحد مكوناتها. 

وللحصول على معلومات حول برامج ال محاكاة يمكنك مراجعة مجتمع النمذجة والمحاكاة 

الدولية (565.018) ومسح البرنامج السنوي في -(ormstoday.com) ORMS Today‏ 

أسئلة مراجعة على القسم :٠١-١‏ 

-١‏ عرف المحاكاة المرئية مع المقارنة بينها وبين المحاكاة العادية. 

؟- قم بوصف مميزات المحاكاة التفاعلية المرئية (1715) (أي: النمذجة التفاعلية المرئية (VIM‏ 

التي تجعلها جذابة لصناع القرار. 

AS -Y‏ يمكن استخدام المحاكاة التفاعلية المرئية (1715) في إدارة العمليات؟ 

-٤‏ كيف يشبه فيلم الرسوم المتحركة تطبيق ۷18؟ 

تلخيص لأهم نقاط الفصل: 

- تلعب النماذج - متعددة الأنواع - دورّا رئيس ا في أنظمة دعم القرار لأنها ُستخدم لوصف 
مواقف حقيقية لصنع القرار. 

- يمكن أن تكون النماذج ثابتة (أي لقطة مفردة لموقف ما) أو متحركة (أي فترة متعددة). 

- يتم إجراء التحليل تحت درجة تأكد مفترضة (والذي يعتبر مقبولًا بنسبة كبيرة) أو الخطر أو 
عدم التأكد (والذي يعتبر مقبولًا بنسبة ضئيلة). 

- يعرض ال مخططات البيانية التأثيرية بيانيًا العلاقات الداخلية لنموذج ما. ويمكن استخدامها 
لتعزيز استخدام تقنية جداول البيانات. 

- يوجد لدى جداول البيانات العديد من القدرات» بما في ذلك تحليل ”ماذا - لو"» والبحث عن 
الهدف. والبرمجة» وإدارة قواعد البيانات» والوصول للوضع الأمثلء وام محاكاة. 

- يمكن لكل من جداول القرار وأشجار القرار أن تقوم بنمذجة وحل مشاكل بسيطة لصنع القرار. 

- تعتبر الإرمجة الرياضية منهجًا مهما للوصول للوضع الأمثل. 

- تعتبر الإرمجة الخطية هي أكثر طرق البرمجة الرياضية انتشارًا. فهي تحاول تحقيق التخصيص 
الأمثل للموارد المحدودة تحت قيود تنظيمية. 

- تعتبر الأجزاء الرئيسة لنموذج البرمجة الخطية هي دالة الهدفء ومتغيرات القرارء والقيود. 
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الفصل السادس 


- تعتبر حل مشاكل صنع القرار متعدد المعايير صعبًا ولكن ليس مستحيلا. 

- ”ماذا - لو“ و”البحث عن الهدف“ هما أكثر الطرق انتشارًا لتحليل الحساسية. 

- تشتمل العديد من أدوات تطوير أنظمة دعم القرار بداخلها على نماذج كمية (كنماذج مالية أو 
إحصائية) أو يمكنها التعامل بسهولة مع مثل هذه النماذج. 

- تعتبر المحاكاة نهج أنظمة دعم القرار واسع الاستخدام؛ إذ تتضمن تجربة ذات نموذج يمثل 
موققًا حقيقيًا لصنع القرار. 

- يمكن للمحاكاة التعامل مع حالات أكثر تعقيدًا من التحسينء ولكنها لا تضمن حلا أمثل. 

- توجد عدة طرق مختلفة للمحاكاةء ويعد بعضها مهما في اتخاذ القرار ومنها محاكاة مونت كارلو 
ومحاكاة الحدث المنفصل. 

eia! VIS/VIM pua; -‏ القرار بالتفاعل المباشر مع أي نموذج ويعرض النتائج بأسلوب سهل الفهم. 

















مصطلحات أساسية: 
التأكد. البحث عن الهدف. | أهداف متعددة. عدم التأكد. 
متغيرغيرقا 
تحليل القرار. المخطط البياني التأثيري. | الحل الأمثل. بل 
E 0‏ للتحكم فيه. 

ل القرا غير النتيجة المتوسط. | مَعْلَمَة Wr‏ 
جدول القرار. متغير النتيجة المتوسط. . (VIM) äs‏ 
S —‏ المحاكاة التفاعلية 
شجرة القرار. البرمجة الخطية (1.2). | نموذج كمي. VIS) i3)‏ 
متغير القرار. a A ia‏ تحليل ”ماذا - لو". 
محاكاة الحدث المنفصل. | محاكاة مونت كارلو. | الخطر. التوقح. 

تحليل متعدد الأبعا 
نماذج متحركة. SEM Jdes| e det‏ 
(نمذجة). 
المسح البيئي والتحليل. | النماذج الثابتة. قخليل الخساسئة: المحاكاة. 
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أسئلة للمناقشة: 

-١‏ كيف ترتبط التحليلات التوجيهية بكل من التحليلات الوصفية والتنبؤية؟ 

۲- اشرح الاختلافات بين النماذج الثابتة والمتحركة. وكيف يكن استنباط أحدهما من الآخر؟ 

- ما هو الفرق بين النهج التفاؤلي والنهج التشاؤمي في صنع القرار تحت درجة عدم التأكد امفترضة؟ 

-٤‏ اشرح اذا يتضمن حل المشاكل تحت درجة عدم التأكد أحيانًا افتراض أن المشكلة يجب أن 
يتم حلها تحت شروط الخطر. 

0- يحتمل أن يكون 8:061 هو برنامج جداول البيانات الأكثر انتشارًا بالنسبة لأجهزة الحاسب 
الشخصية: لماذا؟ وما الذي يمكننا القيام به مع هذه الحزمة لجعلها جذابة جدًا لجهود النمذجة؟ 

-١‏ اشرح كيفية عمل أشجار القرار. وكيف يمكن حل مشكلة معقدة باستخدام شجرة القرار؟ 

۷ اشرح كيف هكن للبرمجة الخطية حل مشاكل التخصيص. 

۸ ما هي مزايا وعيوب استخدام حزمة جداول البيانات لإنشاء وحل نماذج ۲[؟ 

-٩‏ ما هي مزايا وعيوب استخدام حزمة البرمجة الخطية لإنشاء وحل #اذج 1۲؟ 

-٠‏ ماهو الفرق بين تحليل القرار مع هدف واحد وتحليل الق رار مع أهداف متعددة 

(أي المعايير)؟ اشرح الصعوبات التي قد تظهر عند تحليل الأهداف المتعددة. 

-١‏ اشرح عمليًا كيف يمكن ظهور أهداف متعددة. 

۲- قارن بين تحليلي ”ماذا - لو“ و”البحث عن الهدف“. 

-١‏ قم بوصف العملية العامة للمحاكاة. 

15- اذكر بعض المزايا الرئيسة للمحاكاة فوق التحسين والعكس. 

0- يمكن اعتبار العديد من ألعاب الحاسب محاكاة مرئية» اشرح لاذا. 

-١‏ اشرح اذا تكون 7715 مفيدة بشكل خاص في تنفيذ التوصيات المشتقة من أجهزة الحاسب. 

تمارين - شبكة جامعة تيراداتا (11[17) وغيرها من التمارين اليدوية: 

teradatauniversitynetwork.com «3L AS sb e -1‏ وحدد كيف يتم استخدام النماذج في 
حالات ذكاء الأعمال والأوراق. 

؟- قم بإنشاء نماذج جداول البيانات المعروضة في الشكلين (2-5) و(6-5). 
-١‏ ما هو تأثير تغير معدل الفائدة من 8: إلى *٠١‏ في نموذج جدول البيانات المعروض في الشكل (9-5)؟ 
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؟- بالنسبة للنموذج الأصلي في الشكل (7-*). ما هو معدل الفائدة المطلوب لتخفيض الدفعات 
الشهرية بنسبة ١7؟‏ وما هو التغير في مبلغ القرض الذي سيكون له نفس التأثير؟ 
*- في جدول البيانات المعروض في الشكل (4-5)» ما هو تأثير الدفع المقدم بمبلغ ٠٠١‏ دولار كل 
شهر؟ ما هو الدفع المقدم الضروري لسداد القرض في YO‏ عامًا بدلا من P-‏ عامًا؟ 
"- قم بحل مشكلة مزيج المنتجات (8181) التي تم وصفها في هذا الفصلء باستخدام :5019 Excel's‏ 
أو نسخة الطالب من برنامج :5017 Lindo 4 Lindo eL ca». .Lindo (| i I.P‏ 
dindo.com g 35 Je Systems, Inc‏ وكذلك يتوفر غيره - ابحث في الويب. قم باختبار 
تقارير الحل (المخرجات) للإجابات وتقرير الحساسية. هل حصلت على نفس النتائج المذكورة 
في هذا الفصل؟ جرب تحليل الحساسية المشار إليه في الفصل وهو تخفيض الجانب الأيمن 
من القيود التسويقية 00-8 بمقدار وحدة واحدة, أي من ٠١‏ إلى 119. ماذا يحدث للحل 
عندما تقوم بحل المشكلة بعد هذا التعديل؟ قم بإزالة قيد 00-8 الأدنى تمامًا (مكن عمل 
ذلك بسهولة إما بحذفه في ©5017 أو جعل الحد الأدنى صفرًا) ثم قم بإعادة حل المشكلة. ماذا 
يحدث؟ باستخدام الصيغة الأصلية» حاول تعديل معاملات دالة الهدف وانظر ماذا يحدث. 
4- عبر البحث في الويب قم بفحص كيفية استخدام النماذج وحلولها بواسطة إدارة الأمن الوطني 
الأمريكي في ”الحرب ضد الإرهاب”. قم أيضًا بفحص كيفية استخدام الحكومات أو الهيئات 
الحكومية الأخرى للنماذج في مهامها. 
0- هذه المشكلة مساهمة من د. هه15ة18 ع1 من جامعة أوكلاهوما الحكومية. 
لقد ضرب الجفاف مؤخرًا المزارعين بشدة. تأكل الأبقار الذرة الحلوة. 
أنت مهتم بإعداد خطة تغذية للأسبوع القادم لمواشيك باستخدام سبعة منتجات غذائية 
غير تقليدية وهي: )١(‏ حبوب شوكولاتة ددعهط0 :واءسة (7) أصابع الزبدة. (7) حليب» 
"IG‏ كريم Cap'n Crunch oge (0) Lob‏ (1) الذرة الحلوة (لأن الذرة الحقيقية 
كلها ميتة)؛ gól s (V)‏ البسكويت 7إمط4. 

















١ 3‏ شوكولاتة 
شرائح | الذرة | مم08 |1 أصا 
شرائح ر p‏ يس كريم Lucky e‏ 
رمطة | الحلوة | طعمتص© | فائيليا | الزيدة 
Charms‏ 
٤ Vo‏ 0,0 ويد | ملاع ۷ 06 | دولار / رطل 
نعم | لا لا لا نعم | نعم | نعم شوكولاتة 
vo ^ £o 10 vy ۳ w‏ بروتين 
TDN w Y. M 1 M ^ w‏ 
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A‏ شوكولاتة 
شرائح | الذرة | Capan‏ أأيس كريم أصابع شوکو 1 
Ahoy‏ | الحلوة | طعصتص0 | فانيليا ^ | الزبدة agy‏ 
Charms‏ 
Y £ £o Ww Y ١ 0‏ كالسيوم 
وتظهر تكلفة الرطل بالدولارء وكذلك وحدات البروتين لكل رطل تساهم بهء ومجموع العناصر 





الغذائية المنهضمة (11021) التي يساهمون بها لكل رطلء ووحدات الكالسيوم لكل رطل. 
أنت تقدر أن الكمية الإجمالية من منتجات التغذية غير التقليدية تساهم بالمقادير التالية 
من العناصر الغذائية: ٠٠٠٠١‏ وحدة بروتين على الأقل» و0١٠2‏ وحدة 11011 على الأقل» ومن 
٠‏ على الأقل إلى ٠٠٠١‏ على الأكثر وحدة كالسيوم. 
ويوجد أيضًا بعض المتطلبات المتنوعة الأخرى: 
- لا يمكن أن تتجاوز الشوكولاتة في خطة التغذية الشاملة (بالرطل) مقدار العناصر الأخرى 
غير الشوكولاتة. ويعرض الجدول السابق ما إذا كان المنتج يعتبر شوكولاتة أم لا (نعم - 
شوكولاتة» لا - ليس شوكولاتة). 
- لا يمكن أن يشكل أي منتج تغذية واحدًا أكثر من >٠١‏ من الوزن الإجمالي (بالرطل) اللازم 
لإنشاء مزيج تغذية مقبول. 
- هناك نوعان من الحبوب (شوكولاتة kaS Y (Cap'n Crunchg Lucky Charms‏ 
مجتمعين أن يكونا أكثر من >٤١‏ (بالرطل) من المزيج الإجمالي لتلبية متطلبات المزيج. 
حدد المستويات المثلى للمنتجات السبعة لوضع خطة تغذية أسبوعية خاصة بك بحيث تتدنّ التكلفة. 
لاحظ أن كل مقادير المنتجات يجب ألا تحتوي على قيم كسرية (عدد الرطل أرقام صحيحة فقط). 
1- هذا التمرين مساهمة من د. 5811502 1161 من جامعة أوكلاهوما الحكومية لتوضيح قدرات 
النمذجة نامج .Excel Solver‏ 
نت تعمل مع مجموعة كبيرة من العمال ا مؤقتين (مجموعة من اممتدربين وا متقاعدينء إلخ) 
لوضع مسودة خطة لفريق عمل مركز اتصال ليلي (للمستقبل القريب). لديك أيضًا مجموعة 
صغيرة من العمال المتفرغين الذين هم ”ثوابتك“ - ولكنك وضعتهم بالفعل في الجدول» وقد أدى 
ذلك إلى متطلبات لتشغيل عمالة لديك. وأنت لا تهتم في النموذج بالعمال امتفرغين. 
وتكون متطلبات تشغيل العمالة يومية وهي: ١9‏ ليوم الاثنينء ٠١‏ ليوم الثلاثاءء 15 ليوم 
الأربعاء ۲۲ ليوم الخميس» ۷ ليوم الجمعة» ۲۲ ليوم السبت و٠۲‏ ليوم الأحد. 
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لديك من ۸ إلى ٠١‏ منهم لا يستطيعون العمل في عطلة نهاية الأسبوع (السبت أو الأحد). 
بالنسبة لهؤلاء الناس ”في يوم واحد فقط من أيام الأسبوع“» هناك ثلاث ورديات ممكنة: 
فسيعملون 6 أيام من إجمالي 0 أيام عمل في الأسبوع, وتحصل إحدى الورديات على عطلة في 
يوم الثلاثاء» ووردية أخرى في يوم الأربعاءء ووردية ثالثة في يوم الخميس. 
وعليك أن تخصص ثمانية أشخاص على الأقل لهذه الورديات ”في يوم واحد فقط من أيام sull‏ 
وبالنسبة لجميع الورديات الأخرى (ولا تتقيد بحجم العمالة المشغلة)» يعمل الشخص ٤‏ 
أيام من إجمالي / أيام كل أسبوع. وسوف يعمل العمال بلدة أسبوعين ويومّي عطلة نهاية 
الأسبوع (وردية ” / 7"). وتعتبر جميع التوليفات «ذات اليومين» اليومية الممكنة ورديات 
عمل مرتبطة ماعدا أي توليفات يحصل فيها العمال على عطلة ثلاثة أيام متتاليةء فتلك الأيام 
غير مسموح بها ولا يجب أن تكون في النموذج. 
نحن نعمل بنموذج بسيط جدًا - وبدون تكاليف؛ إذ يكون الهدف من نموذجنا هو إيجاد 
أقل عدد من العمال الذي يلبي الحد الأدنى اليومي المطلوب لمركز الاتصال ولا يتم الاستعانة بأكثر 
من أربعة عمال إضافيين (فوق الحد الأدنى للمتطلبات) خلال أي يوم واحد. 
كذلكء لا يمكن لجميع الورديات (”يوم واحد فقط من أيام الأسبوع“ أو ورديات ؟ / ) أن 
«يخصص» لها أكثر من ستة أشخاص. 
قم بإنشاء نموذج أساسي يقبل بهذه القيود ويعمل على تدنية العدد الإجمالي للأشخاص المطلوبين 
لتحقيق الحد الأدنى من المتطلبات. إذا كان هناك مشكلةء نعم» عدد الأشخاص عدد صحيح. 
-١/‏ هذا التمرين أيضًا مساهمة من د. 18711502 18161 من جامعة أوكلاهوما الحكومية. يحاي السيناريو 
البسيط التال Book”‏ ه81“ الموصوف في مقالة Business Week‏ عن إنتاج الكوكاكولا من عصير 
البرتقال. http://www.businessweek.com/articles/2013 -01- 31 coke-engineers-its-)‏ 
may 34 sLX3b e-5 (orange-juice-with-an-algorithm, accessed February 2013‏ 
خطية (1.2) مناسب لهذا السيناريو. 
بالنسبة للفترة الإنتاجية التالية يوجد خمس دفعات مختلفة من عصير البرتقال الخام يمكن 
خلطها معًا -Orenthal James .GlowMorn .SunnyQ «JU3;J! jas colezie gua‏ 
في تكوين الخليط الأمثل من المنتجات الثلاثة من الدفعات الخمس المختلفة» يجب أن يهدف 
نموذج البرمجة الخطية إلى تعظيم صافي سعر البيع لكل جالون من امنتجات وتخفيض التكلفة 
المقدرة لكل جالون من العصير الخام. 
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ويتم هنا وصف خمس دفعات خام من عصير البرتقال من حيث «Ils (Brix) $532Jl àz j5‏ 
(ملنا) والمخزون المتاح (جالون) والتكلفة (دولار / جالون)» وكلها ذاتية التفسير: 
- دفعة -١‏ أناناس برتقال VY ogl Yo- pulp = 4Y brix = VI A‏ دولار / جالون. 
- دفعة ۲- آناناس برتقال 8 ۱۷ = brix‏ ۰,۹ = مانام ۲۰۰ جالون» ۴۲۲ دولار / جالون. 
- دفعة ۳- متوسط الحلاوة pulp = sA brix = Ye‏ ۱۷۵ جالون» ٠٤,۳‏ دولار / جالون. 
- دفعة -٤‏ فالنسیاء ۱۸ = ×اطء ۲,٢‏ = ملام ۳۰۰ جالونء ٤1,۲‏ دولار / جالون. 
- دفعة 0- برتقال تیمہل» ۲٣۵ pulp = 4,7 brix = Vé‏ جالون» 0٥,۲‏ دولار / جالون. 
لاحظ أنه للتأكد من أن العصير الخام لا يصبح ”قديّا“ جدّا مرور الوقت» فإن أحد متطلبات 
الإنتاج هو أنه يتم بالضرورة استخدام “0٠‏ على الأقل من المخزون المتاح من كل دفعة في خلط 
منتجات عصير البرتقال الثلاثة (وبالطبع لا يمكن استخدام أكثر من المتاح). 
من منظرر المنتج» يجب أن يكون هناك ٠٠١‏ جالون على الأقل من خليط Wos SunnyQ‏ 
جالون على الأقل klg .Orenthaljamesg GlowMorn i JS ġa‏ يشير الطلب المس تقبلي 
المتوقع على المنتجات إلى أنه في هذه الفترة يلزم وجود إنتاج تام مقدار ٠٠١‏ جالون على الأكثر من 
SunnyQ‏ وهل/ا؟ جالونًا على الأكثر من 610131012, و١٠٠٠‏ جالون على الأكثر من وعدمة[ ل طامع0. 
لاحظ أيضّاء أنه عند خلط المنتجات من الدفعات الخمس.ء فإن الدفعة المنفردة لا يمكنها أن توفر 
أكثر من “6٠‏ من إجمالي كمية أي منتج تام» ويتم تطبيق ذلك على كل منتج على حدة. 
وتشمل سمات اممنتجات الثلاثة ما يلي: 
- سعر البيع. 
- الحد الأقصى ممتوسط درجة حلاوة (×إطا) امنتج المخلوط النهائي. 
- الحد الأدنى لمتوسط درجة حلاوة (0ذ:0) المنتج المخلوط النهائي. 
- الحد الأقصى لمحتوى اللب. 
وتشير متطلبات ”المتوسط” الثلاثة إلى أن المتوسط. المرجح لكل العصير المخلوط ببعضه لذلك 
يجب أن يحقق انتج تلك المواصفات. 
JI ss :SunnyQ -‏ & = 11,۳ $ / جالون. 15 = .Max Pulp =1 Min Brix = 14,0 Max Brix‏ 
-Max Pulp - VA ;Min Brix -ViYo Max Brix = ¥ «jJl / $ 16" = & Jl js :GlowMorn -‏ 
OrenthalJames -‏ سعر البيع - ثرالا 3 / جالون: 1۷,۷0 = Min Brix = 1¥,00 Max Brix‏ ارا - „Max Pulp‏ 
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مفاهيم وأدوات البيانات الضخمة 


أهداف التعلم: 
- تعلّم ما هي البيانات الضخمة وكيف تجعل عام التحليلات يتغير. 
- فهم الحافز لتحليلات البيانات الضخمة وقائدي العمل لها. 
- الدراية التامة بنطاق عريض من تمكين التقنيات لتحليلات البيانات الضخمة. 
- تعلّم s NoSQLs MapReduces Hadoop‏ حيث ارتباطها بتحليلات البيانات الضخمة. 
- مقارنة وتناقض الاستخدامات المكملة لمستودعات البيانات وتقنيات البيانات الضخمة. 
- الدراية باختيار منصات وخدمات البيانات الضخمة. 
- فهم الحاجة إلى تحليلات التيار (تدفق البيانات) وتقدير إمكانياتها. 

- تعلّم تطبيقات تحليلات التيار (تدفق البيانات). 

لا تعتبر البيانات الضخمة - والتي تعني أشياء كثيرة لكثير من الناس - تقليعة تقنية جديدة. 
فقد ا من أولويات الأعمال التي من ال محتمل أن تغير خريطة ال منافسة بشكل عميق في 
الاقتصاد المتكامل على الصعيد العالمي في هذه الأيام» بالإضافة إلى توفير حلول ابتكارية لتحديات 
الأعمال الدائمة؛ إذ تسعى البيانات الضخمة والتخليلات لإيجاد طرق جديدة لتحويل عمليات 
ومنظمات وصناعات بأشرها وحتى المجتمع بالكامل. غير أن التغطية الإعلامية الشاملة تجعل 
من الصعب التمييز بين الدعاية والواقع. ويهدف هذا الفصل إلى توفير تغطية شاملة للبيانات 
الضخمة وتقنياتها التمكينية ومفاهيم التحليلات المرتبطة بها؛ وذلك للمساعدة في فهم قدرات 
وقيود هذه التقنية حديثة الظهور. فيبدأ الفصل بتعريف البيانات الضخمة ومفاهيمها المرتبطة, 
ياي ذلك التفاصيل الفنية للتقنيات التمكينية. والتي منها .NoSQLg MapReduceg Fadoop‏ 
ونقدم أيضًّا تحليلًا مقارنًا بين مستودعات البيانات وتحليلات البيانات الضخمة. في حين يتم 
تخصيص الجزء الأخير من الفصل لتحليلات التيارء والتي تعتبر إحدى أقيم المقترحات الواعدة 
لتحليلات البيانات الضخمة. 
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V-V‏ مقال افتتاحي: تحليل حركة العملاء في شركة اتصالات باستخدام طرق 
البيانات الضخمة: 


Ll 


أرادت شركة اتصالات (تسمى 3م1616 ۸٥5‏ [41] لأسباب تتعلق بالخصوصية) الحد من تحول 
العملاء عن خدمات الاتصالات الخاصة بها. وبالرغم من أن انتقال العملاء بين الشركات في صناعة 
الاتصالات يعد أمرًا شائعًاء إلا أن شركة ۸7 كانت تفقد عملاءها بمعدل مقلق. وهذه ظاهرةٌ لها عدة 
أسباب وأيضًا لها حلولٌ ممكنة. فقد علمت إدارة الشركة أن العديد من الإلغاءات كانت بسبب مكالمات 
بين العملاء وقسم خدمة العملاء. ولدراسة المشكلة بصورة أعمق» تم تشكيل لجنة تضم أعضاء من 
مكتب علاقات العملاء وقسم تقنية المعلومات» وكانت مهمتهم هي النظر في كيفية تقليص مشكلة تحول 
fly Masi‏ على تحليل .Kalgotras Zadeh Shardag Asamoah) Masi JLasl blef‏ 2016(- 


عقبات البيانات الضخمة: 
عندما يواجه العملاء مشكلة في مسائل معينة مثل الفواتير الخاصة بهم والخطة وجودة 
المكالىة: فإنهم يتواصلون مع الشركة بطرق متعددة, منها: مركز الاتصال «(call center)‏ وموقع 
الويب الخاص بالشركة (من خلال روابط اتصل بنا ”15 0218©1©"): ومركز خدمة الحضور الشخصىي 
(walk-ins)‏ ومكن للعملاء إلغاء أي حساب من خلال إحدى التفاعلات المذكورة. أرادت الشركة 
النظر فيما إذا كان تحليل تفاعلات العملاء هذه يمكن أن يُنتج أي أفكار حول أسئلة العملاء أو قناة 
(قنوات) الاتصال التي استخدموها قبل إلغاء حسابهم. وظهرت البيانات التي تم إنشاؤها بسبب 
هذه التفاعلات إما في صورة نصية أو صوتية. ولذا؛ سينبغي على شركة ۸۲ آن تقوم بتجميع 
كل البيانات في موقع واحد. فقامت الشركة بفحص استخدام المنصات التقليدية لإدارة البيانات» 
ولكنها اكتشفت سريعًا أنها غير كافية ملعالجة تحليل البيانات المتقدم في السيناريو الذي يحتوي 
على تنسيقات متعددة للبيانات من مصادر متعددة (0هقتناط]' و5880 وتإدمطتصف 2010). 
كان هناك تحديان رئيسان في تحليل هذه البيانات وهما: المصادر المتعددة للبيانات والتي 
تؤدي إلى مجموعة متنوعة من البيانات وكذلك الحجم الكبير للبيانات. i‏ 
-١‏ البيانات من مصادر متعددة: يستطيع العملاء التواصل مع الشركة عن طريق الوصول إلى 
حساباتهم على موقع الويب الخاص بالشركة» مما يسمح لشركة '41 بإنشاء سجل معلومات 
على الويب حول نشاط العميل. وقد تمكّنت الشركة باستخدام مسار هذا السجل من تحديد 
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ما إذا كان العميل قد قام عبر الإنترنت بمراجعة خطته الحالية أو استلامها أو تقديم شكوى 
بشأنها أو التحقق من الفاتورة وكذلك تحديد متى قام بذلك. وفي مركز خدمة OS Mas]‏ 
للعملاء أيضًا تسجيل شكوى بشأن الخدمة أو تقديم طلب بتغيير الباقة أو إلغاء الخدمة. 
سُحِلَتْ هذه الأنشطة في نظام معاملات الشركة وبعد ذلك في مستودع بيانات المنشأة. وأخيراك 
يمكن للعميل الاتصال بمركز خدمة العملاء هاتفيًا وإجراء معاملاته التجارية وكأنه موجود 
شخصيًا ف مركز خدمة العملاء. وكانت سجلات المكالمات متاحة في نظام واحد مع سجل 
بالأسباب التي يتصل العميل من أجلها. ومن أجل إجراء تحليل له معنىء كان لا بد من 
تحويل مجموعات البيانات الفردية إلى تنسيقات مهيكلة متشابهة. 

-٠‏ حجم البيانات: كان التحدي الثاني هو الكمية الهائلة من البيانات من المصادر الثلاثة التي 
استلزم الأمر استخراجها وتنظيفها وإعادة هيكلتها وتحليلها. وبالرغم من أن غالبية مشروعات 
تحليلات البيانات السابقة اعتمدت على مجموعة عينات صغيرة من البيانات» إلا أن شركة 
قررت الاستفادة من التنوع المتعدد ومصادر البيانات جنبًا إلى جنب مع الحجم الكبير 
للبيانات المسجلة لتوليد العديد من الأفكار كلما أمكن. 
إن النهج التحليلي الذي يمكنه استخدام جميع قنوات ومصادر البيانات» رغم ضخامتهاء سيكون 

قادرًا على توليد أفكار غنية وعميقة من البيانات للمساعدة في تقليل الإلغاءات. 


الحل: 

تم الاعتماد على بنية موحدة للبيانات الضخمة من شرکة (Teradata Aster) & Ld lı‏ 
لإدارة وتحليل البيانات الضخمة ذات الهيكلة المتعددة. وسنعرض في القسم (1-1) بشيء من 
Guy (V-V) S oe LS Teradata Aster åS) Jea‏ تخطيطيًا للبيانات التي تم 
تركيبها. وقد تم إنشاء ثلاثة جداول بناءً على كل مصدر للبيانات» حيث يحتوي كل جدول على 
المتغيرات التالية: رقم العميلء وقناة الاتصالء وختم التاريخ / الوقت. والإجراء المتَخَذ. وقبل 
الإلغاء النهائي للخدمة» يمكن لمتغير الإجراء المتخذ أن يكون واحدًا أو أكثر من هذه الخيارات 
الإحدى عشرة (التي تم تبسيطها لهذه الحالة): تقديم الاعتراض على الفاتورة أو طلب تحديث 
الباقةء أو طلب تخفيض الباقةء أو القيام بتحديث الملف الشخميء» أو عرض ملخص الحساب» 
أو الوصول إلى دعم العملاءء أو عرض الفاتورة أو مراجعة العقد. أو الوصول إلى وظيفة تحديد 
موقع المتجر على الويب» أو الوصول إلى قسم الأسئلة المتكررة على الويب» أو استعراض الأجهزة. 
وقد ركز هدف التحليل على إيجاد ا مسار الأكثر شيوعًا ا مودي إلى إلغاء الخدمة نهائيًا. وقد تم 
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تقسيم البيانات إلى مجموعة سلسلة من الأحداث تشتمل على عميل معين في فترة زمنية محددة 
(ه أيام على جميع قنوات الاتصال) كجلسة واحدة. sls‏ تم استخدام وظيفة 22208 لتسلسل 
الوقت الخاصة Aster åS żo‏ (والتي تم تفعيلها في إطار ع©011ع1م343-.501) لتحليل الاتجاهات 
الشائعة التي أدت إلى إلغاء الخدمة. 























Sources: Teradata Corp. 
Teradata Aster مصادر بيانات متعددة مدمجة في‎ :١-/ شكل‎ 


النتائج: 

أشارت النتائج الأولية إلى العديد من المسارات التي قد تؤدي إلى طلب إلغاء الخدمة, مما 
من الشركة من تحديد آلاف الطرق التي قد يلجأ إليها العميل لإلغاء الخدمة. وتم إجراء تحليل 
متابعة لتحديد أكثر الطرق تكرارًا تطلبات الإلغاء. وتم الاصطلاح على هذا الإجراء باسم الممسار 
الذهبي ”22:5 «ع6010“. وتم تحديد ٠١‏ مسارًا كانوا هم الأكثر تسببًا في الإلغاء في الأجل القصير 
أو الطويل. ويعرض الشكل (۲-۷) عينة لذلك. 

وقد ساعد هذا التحليل الشركة على تحديد العميل قبل إلغاء الخدمة وتقديم حوافز له أو على 
الأقل تصعيد قرار المشكلة إلى مستوى لا يرتقي إلى إلغاء الخدمة من جانب العميل. 
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مركز الإتصال:إلعاء الخدمة :مركز اقسق 


مشاكل القراتير 
متجر إتغاء الخدمة 


Je Xon 
اشكاوى الخدمة‎ 


Mis: pie 
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متجر:الحسايات الجديدة 











متجر:شکاری 





Sources: Teradata Corp. 


شكل ۲-۷: التصوير البياني لأعلى عشرين مسارًا للتصوير 

ماذا يمكننا أن نتعلم من هذه المقالة القصيرة: 

لا تتطلب كل مشاكل الأعمال استخدام منصة تحليلات البيانات الضخمة: بالرغم من أنه 
يُفضل استخدامها في هذا الموقف. وكان التحدي الرئيسي يدور حول خصائص البيانات محل 
البحث. وقد مثلت الأنواع الثلاثة ا مختلفة من مجموعات بيانات تفاعل العميل تحديًا في 
التحليل. كانت تنسيقات وحقول البيانات المتولدة في كل من هذه الأنظمة ضخمة:ء وكذلك كان 
حجم تلك البيانات كبيراء مما أدى إلى ضرورة استخدام منصة تستخدم تقنيات تسمح بتحليل 
حجم هائل من البيانات التي تأت في تنسيقات متنوعة. 

وما يسترعي الانتباه أيضًا هو قيام شركة 47 بتوفيق أسئلة البيانات المطروحة على إستراتيجية 
أعمال المنظمة. وقد أخبرت الأسئلة أيضًا عن نوع التحليل الذي تم إجراؤه. ومن المهم تَمَهُم 
أنه بالنسبة لأي تطبيق لبنية البيانات الضخمة: فإن إستراتيجية أعمال المنظمة وتوليد الأسئلة 
المرتبطة هما مفاتيح تحديد نوع التحليل المراد إجراؤه. 
أسئلة مراجعة على المقالة الافتتاحية: 
-١‏ ما هي المشكلة التي أحدثها إلغاء خدمة العملاء لاستمرار أعمال شركة '41؟ 
-١‏ اذكر مع الشرح العقبات الفنية التي تحدثها طبيعة وخصائص بيانات شركة ۸1. 
“- ما هو تقسيم البيانات؟ وماذا تحتم على AT‏ القيام بتقسيم بياناتها؟ 
ع- قم بإعداد دراسات أخرى تم فيها استخدام نماذج تحول العميل. ما هي أنواع المتغيرات التي 

تم استخدامها في تلك الدراسات؟ كيف تختلف هذه امقالة الافتتاحية؟ 
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0- اذكر منصات أخرى شائعة غير ما 2182021 لتحليلات البيانات الضخمة التى بمكنها 
التعامل مع التحليل الموضح في الحالة السابقة. 


Y-V‏ تعريف البيانات الضخمة: 

يُشَكل استخدام البيانات لفهم الزبائن / العملاء وعمليات الأعمال بهدف الحفاظ على 
(وتعزيز) التمو والربحية تحديًا كبيرًا ويتزايد هذا التحدي بالنسبة لمؤسسات اليوم. وقد 
أصبحت معالجة البيانات بالوسائل التقليدية في حينها غير عمليةء وذلك بسبب توافر المزيد 
والمزيد من البيانات في مختلف الأشكال والأنمماطء وتسمى هذه الظاهرة في وقتنا الراهن ب 
”البيانات الضخمة“. حيث تحظى بتغطية إعلامية كبيرة بالإضافة إلى استحواذها على اهتمام 
مستخدمي الأعمال ومتخصصي تقنية المعلومات بشكل متزايد. ونتيجة لذلك؛ فقد أصبح هناك 
مبالغة وإفراط في استخدام عبارة البيانات الضخمة مما جعلها عبارة طنانة في التسويق. 

وبالنسبة لذوي الاهتمامات والخلفيات المختلفة فإن البيانات الضخمة تعني لهم أشياء مختلفة. 
وقد تم استخدام مصطلح البيانات الضخمة بشكل تقليدي لوصف الكميات الهائلة من البيانات 
التي تم تحليلها عن طريق منظمات ضخمة مثل جوجل أو مشاريع العلوم البحثية في ناسا. غير 
أن هذا المصطلح يُعد مصطلحًا نسبيًًا لمعظم الأعمال؛ فكلمة ”ضخمة" تعتمد على حجم المنظمة. 
حيث تدور النقطة الأساسية حول إيجاد قيمة جديدة داخل وخارج مصادر البيانات التقليدية. 
وتكشف إزاحة حدود تحليلات البيانات عن إحصاءات وفرص جديدةء وتعتمد كلمة «ضخمة» 
على المكان الذي بدأت منه وكيف يسير تقدمك. وينبغي أن تضع في اعتبارك الوصف العام 
للبيانات الضخمة. فالبيانات الضخمة هي التي تتجاوز نطاق بيئات الأجهزة شائعة الاستخدام 
أو قدرات أدوات البرامج المستخدمة لجمعها وإدارتها ومعالجتها في خلال فترة زمنية مقبولة من 
قبل المستخدمين. وقد أصبح مصطلح البيانات الضخمة مصطاحًا شائعًا لوصف النمو المتسارع» 
ومدى توفرء واستخدام ا معلومات» سواء كان مهيكلًا أم لا. وقد كتب الكثيرون عن اتجاه البيانات 
الضخمة وكيف يكن أن يكون بمثابة أساس للابتكار» والمفاضلة» والنمو. وبسبب التحديات 
التقنية في إدارة الحجم الكبير للبيانات الواردة من مصادر متعددة: وأحيانًا بسرعة كبيرة فقد تم 
Sources: Asamoah, D., Sharda, R., Zadeh, A., & Kalgotra, P. (2016). Preparing big Data analytics professional:‏ 
A pedagogic experience. In DSI 2016 Conference, Austin, TX. Thusoo, A., Shao, Z., & Anthony, S. (2010).‏ 


Data warehousing and analytics infrastructure at Facebook. In Proceedings of the 2010 ACM SIGMOD 
International Conference on Management of Data {p. 1013). doi: 10.1145/1807167. 1807278. 
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تطوير تقنيات جديدة إضافية للتغلب على التحديات التقنية. وعادةً ما ترتبط عبارة البيانات 
الضخمة بهذه التقنيات. وفي بعض الأحيان يتم توسيع مصطلح «البيانات الضخمة» على أنه 
تحليلات البيانات الضخمةء وذلك بسبب أن الاستخدام الأساسي لتخزين مثل هذه البيانات يؤدي 
للحصول على إحصاءات من خلال التحليلات. غير أن هذا المصطلح يصبح ذا محتوى مرن؛ إذ قد 
يعني أشياء مختلفة لأشخاص مختلفين. وفي هذا الفصل سوف نقوم باستخدام المصطلح الأصلي» 
لأن هدفنا هو تعريفك بمجموعات البيانات الضخمة وقدراتها في توليد الأفكار. 

من أين تأتي البيانات الضخمة؟ أبس ط إجابة عن هذا السؤال هي أن البيانات الضخمة «في 
كل مكان». حيث يتم التعامل الآن مع المصادر التي تم تجاهلها بسبب القيود الفنية على أنها 
مناجم ذهب. وقد تأت البيانات الضخمة من سجلات الويب» وتحديد الهوية للموجات اللاسلكية 
)N۸۴2(‏ والأنظمة العابمية لتحديد المواقع (625): وشبكات الاستشعارء والشبكات الاجتماعية, 
والوثائق النصية المعتمدة على الإنترنت» وفهارس البحث على الإنترنت» والسجلات التفصيلية 
للمكاطمات» وعلم الفلك» وعلوم الغلاف الجوي» وعلم الأحياء» وعلم الجينات» والفيزياء النوويةء 
والتجارب البيوكيميائيةء والسجلات الطبيةء والبحوث العلميةء وا مراقبة العسكريةء وأرشيف 
الصور الفوتوغرافية» وأرشيف الفيديوء بالإضافة إلى ممارسات التجارة الإلكترونية على نطاق 
واسع. وليست البيانات الضخمة بالشيء الجديد. لكن الجديد هو التغير المستمر في تعريف 
وهيكل البيانات الضخمة. ومنذ ظهور مستودعات البيانات في أوائل التسعينيات فإن الشركات 
تقوم بتخزين وتحليل كميات ضخمة من البيانات. وعلى الرغم من أن تيرابايتس ”وعاتزطهيع)“ 
كان يُستخدم كمرادف لمستودعات البيانات الضخمة: إلا أن هذا المصطلح تم استبداله الآن 
مصطلح إكسابايتس Jljlog “exabytes”‏ معدل النمو في حجم البيانات مستمرًا في التصاعد 
مع سعي ال منظمات إلى تخزين وتحليل مستويات أعلى من تفاصيل المعاملات» فضلًا عن بيانات 
الويب والميكنة, لاكتساب فهم أفضل لسلوك العملاء وسير الأعمال. 

ويعتقد الكثير من (الأكادمميين ومحللي / قادة الصناعة على حد سواء) أن إطلاق عبارة 
«البيانات الضخمة» على البيانات ذات الحجم الهائل هي تسمية خاطئة. فما تقوله وما تعنيه 
ليس بالضبط نفس الشيء. بمعنى أن البيانات الضخمة ليست فقط «ضخمة». فحجم البيانات 
الهائل هو خاصية واحدة فقط من ضمن عدة خصائص والتي ترتبط في الغالب بالبيانات الضخمة 
وتتضمن هذه الخصائص كلا من التنوع والسرعة. والصدق» والتقلب» واقتراح القيمةء وغيرها. 
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تعريف البيانات الضخمة من خلال مصطلحات ”۷“: 

wolume البيانات الضخمة من خلال المصطلحات الثلاثة للاختصار ”۷“ وهي: الحجم‎ Ne: 
وبالإضافة إلى هذه الاختصارات الثلاثة ”۷“ فإننا نرى‎ velocity ås plg variety g gilo 
بعض المقدمين الرواد لحلول البيانات الضخمة يضيفون عددًا من ”7“ الأخرى» مثل الصدق‎ 
-value proposition بالإضافة إلى اقتراح القيمة‎ (SAS) variability gL (IBM) veracity 

الحجم: من الواضح أن السمة الأكثر شيوعًا للبيانات الضخمة هي الحجم. وقد ساهمت عدة 
عوامل في الزيادة الهائلة في حجم البيانات. مثل البيانات القائمة على المعاملات والتي تم تخزينها على 
مر السنين» والبيانات النصية المتدفقة باستمرار من وسائل التواصل الاجتماعيء والكميات المتزايدة من 
بيانات الاستشعار التي يتم جمعهاء بالإضافة إلى بيانات 101715 و65 التي يتم إنشاؤها تلقائيّه وغيرها. 
وقد أدى حجم البيانات المفرط في الماضي إلى ظهور مشاكل في التخزين» سواء كانت هذه المشاكل فنية 
أو مالية. غير أنه حاليًا ومع استخدام التقنيات المتطورة والمقترنة بتناقص تكاليف التخزينء فإن هذه 
المشكلات لم تعد مهمة؛ وبدلًا من ذلك. فقد ظهرت مشكلات أخرىء ومنها كيفية تحديد الملاءمة فيما 
بين كميات كبيرة من البيانات وكيفية إنشاء قيمة من البيانات التي تعتبر ذات صلة. 

وكما ذكر من قبل, فإن مصطلح ضخمة هو مصطلح نسبي. فهو يتغير بمرور الوقت كما تختلف 
النظرة إليه باختلاف المنظمات. ومع الزيادة ال مذهلة في حجم البيانات» فإن تسمية المستوى التالي 
من البيانات الضخمة أيضًا كانت تمثل تحديًا كبيرَ. وقد استبدلت أعلى مجموعة من البيانات 
والتي كانت تسمى بيتابايتس 7165إ2]اءم (518) ليحل محلها زيتابايتس (21) والتي هي عبارة 
عن تريليون جيجابيت (08) أو مليار تيرابايت (18). euis‏ رؤية فنية )1١1(‏ بلحة عامة عن 
حجم وتسمية وحدات مستودعات البيانات الضخمة. 

ومن منظور تاريخي قريب فإن العام كان يملك حوالي ٠.8‏ 218 من البيانات في عام ۲۰٠۹‏ 
وبحلول عام ٠٠١‏ تخطت هذه المجموعة حاجز ال ١‏ 28؛ وفي نهاية عام 701١‏ كان العدد قد 
وصل إلى ١,8‏ 28. ومن المتوقع أن يصل العدد إلى ££ -(Adshead, 2014) Y -Y- ele Jsleo ZB‏ 
ومع نمو أجهزة الاستشعار وشبكة الإنترنت للأشياء 1017 - والتي سنقدمها في الفصل التالي)» OB‏ 
هذه التوقعات قد تكون خاطئة. وعلى الرغم من أن هذه الأرقام مذهلة من حيث الحجم, فإن 
التحديات والفرص التي gb‏ معها هي أيضًا كذلك. 

رؤية فنية /ا-1: حجم البيانات يتضخم بشكل أكبر وأكبر 

إن قياس حجم البيانات يواجه صعوبة في مواكبة الأسماء الجديدة. فنحن جميعًا نعرف الكيلوبايت 

KB)‏ وهو ١٠٠١‏ بايت). والميجابايت (2/1. وهي مليون بايت). والجيجابايت (61: وهي مليار 
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بايت) والتيرابايت (18» وهي تريليون بايت). وخلاف ذلكء فإن الأسماء المعطاة لأحجام البيانات 
جديدة نسبيًا بالنسبة لمعظمنا. ويوضح الجدول التالي ما يأني بعد التيرابايت وما بعده. 














الاسم الرمز القيمة 
كيلوبايت st KB‏ 
ميجابايت v MB‏ 
جيجابايت GB‏ ف 
تيرابايت v TB‏ 
بيتابايت v PB‏ 
إكسابايت y EB‏ 
زيتابايت v ZB‏ 
يوتابايت yt YB‏ 
برونتوبايت* Yes BB‏ 
جيجوبايت* D GeB‏ 





* اسم / رمز لم يعتمد رسميًا حتى الآن من قبل 51 (النظام الدولي للوحدات). 


ضع في اعتبارك أنه يتم إنشاء إكسابايت من البيانات على الإنترنت كل يوم والتي تعادل 
٠‏ مليون قرص فيديو رقمي 0۷5s‏ من المعلومات ذات القيمة. وعندما يتعلق الأمر بكمية 
ا معلومات التي تمتد عبر الويب كل عام» فإن فكرة وجود كميات أكبر من البيانات - وهي 
زيتابايت - ليست بعيدة جدًا. وفي الحقيقة. فإن خبراء الصناعة يقدرون بالفعل أننا سنشاهد 
سنويًا عبر الإنترنت ,1 زيتابايت من حركة مرور البيانات بحلول عام ٠١17‏ - ومن الممكن أن 
تقفز لتصل إلى “,7 زيتابايت بحلول عام .7١٠٠١‏ ومن المتوقع أن تصل زيارات الإنترنت إلى ٠٠١‏ 
جيجابايت لكل فرد سنويًا بحلول عام .7١7١‏ وعند الإشارة إلى يوتابايت» فإنه غالبًا ما يتساءل 
بعض علماء البيانات الضخمة عن مقدار البيانات التي لدى 254 أو 181 عن الناس إجمالا. كما 
أن وضع الشروط الخاصة بآقراص الفيديو الرقمية DVDs‏ يوتابايت سوف يتطلب "0١‏ تريليون 
منهم. أما يوتابايت» والتي هي عبارة عن ١‏ متبوعًا ب لا١‏ صفرّا فإنها إلى الآن لم يتم اعتمادها 
من SI‏ الرسمية غير أنه من الواضح أنها معترف بها من قبل بعض الناس في مجتمع القياس» حيث 
يمكن استخدام هذا الحجم من الضخامة لوصف مقدار بيانات الاستشعار التي سوف نحصل 
عليها من الإنترنت في العقد القادم» إن م يكن قبل ذلك. 
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أما بالنسبة ل جيجوبايت فهي تمثل ٠١‏ مرفوعة إلى الأس ."١‏ وفيما يتعلق بالمصدر الذي تأتي 
منه البيانات الضخمة, فإنه يجب أخذ ما يلي في الاعتبار: 
- يقوم مصادم الهدرونات الكبير 5871© بتوليد ١‏ بيتابايت في الثانية الواحدة. 
- تنتج أجهزة الاستشعار من محرك طائرة بوينغ "١‏ تيرابايت من البيانات كل ساعة. 
- يتم استيعاب ٠٠١‏ تيرابايت من البيانات الجديدة كل يوم في قواعد .Facebook «bbs‏ 
- يتم تنزيل ٠٠١‏ تسجيل من تسجيلات الفيديو في الدقيقة. مع ترجمة ١‏ تيرابايت كل دقيقة على اليوتيوب. 
- سوف يقوم التلسكوب المقترح لمقياس الكيلومتر المربع (وهو أكبر تلسكوب في العام) بتوليد 

إكسابايت من البيانات يوميًا. 

التنوع: تتشكل البيانات في الوقت الحاضر بجميع أنواع التنسيقات - بدءًا من قواعد البيانات 
التقليدية إلى مخازن البيانات الهرمية والتي أنشئت من قبل المستخدمين النهائيين بالإضافة إلى أنظمة 
المعالجة التحليلية الفورية» والوثائق النصية, والبريد الإلكترونيء و.5/1 والبيانات التي جُمِعَت بواسطة 
جهاز استشعارء وبيانات الاستشعارء فضلًا عن بيانات الفيديو. والصوت وبيانات شريط مؤشرات 
الأمهم. وتشير بعض التقديرات إلى أن ٠٠١‏ إلى 80 من بيانات جميع المنظمات تأخذ أحد الأشكال 
التنظيمية المهيكلة أو شبه المهيكلة (وهو تنسيق غير مناسب ممخططات قواعد البيانات التقليدية)» غير 
أنه لا هكن إنكار قيمتهء وبالتالي» فإنه ينبغي تضمينه في التحليلات من أجل دعم القرار. 

السرعة: وفقًا لما Gartner o;$‏ فإن السرعة يُقصد بها كل من السرعة في إنتاج البيانات ومدى 
سرعة معالجة البيانات (بمعنى أن يتم التقاطها وتخزينها وتحليلها) من أجل تلبية الحاجة أو الطلب. 
وتقوم بطاقات التعريف اللاسلكية 115:19 وأجهزة الاستشعار الآلية بالإضافة إلى أجهزة GPS‏ 
والعدادات الذكية بالعمل على التوجه بالاحتياج المتزايد للتعامل مع سيول البيانات في الوقت ال مناسب 
تقريبًا. وربما تكون السرعة هي الخاصية الأكثر إغفالًا من خواص البيانات الضخمة؛ حيث إن إعطاء 
رد الفعل بسرعة كافية للتعامل مع السرعة يمثل تحديًا لمعظم المنظمات. وبالنسبة للبيئات ذات 
الحساسية تجاه الوقتء فإن ساعة التكلفة البديلة للبيانات تبدأ بتحديد اللحظة التي يتم فيها إنشاء 
البيانات. ومع مرور الوقت, تتراجع القيمة المقترحة للبيانات إلى أن تصبح في نهاية !مطاف عدهة 
القيمة. ويؤدي الوصول إلى البيانات والاستجابة للظروف بشكل أسرع دائمًا إلى نتائج أكثر فائدة. 
سواء أكان الموضوع يتعلق بصحة المريضء أو سلامة نظام ا مرورء أو صحة السندات الاستثمارية. 

وفي عاصفة البيانات الضخمة التي نشهدها حاليّاه فإن جميع الأشخاص تقريبًا يركزون على 
تحليلات حالة الراحة وعناتإلهصة أوع-]4: وذلك باستخدام أنظمة برامج وأجهزة مُحَسَّنة لتجميع 
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كميات كبيرة من مصادر البيانات المختلفة. وعلى الرغم من أن هذا الأمر مهم للغاية فضلًا عن 
قيمته العاليةء إلا أن هناك فئة أخرى من التحليلات. مدفوعة بسرعة البيانات الضخمة, وتسمى 
«تحليلات تدفق البيانات» أو «التحليلات في حالة الحركة»» والتي تتطور بسرعة. فإذا تم القيام 
بتحليلات تدفق البيانات بشكل صحيح ففي هذه الحالة يمكنها أن تكون ذات قيمة كبيرة, بل إنها 
قد تكون أكثر قيمة في بعض بيئات العمل من تحليلات حالة الراحة 5عناتإلهصة gwg .at-rest‏ 
نتناول هذا الموضوع بشيء من التفصيل لاحقًا في هذا الفصل. 

الصدق: الصدق هو مصطلح تم صياغته بواسطة 1182/1 والذي يُستخدم على أنه ال ”7“ الرابعة 
لوصف البيانات الضخمة. ويشير هذا ا مصطلح إلى التطابق مع الحقائق: الدقة, أو الجودة, أو 
الصدقء أو الثقة في البيانات. وغالبًا ما يتم استخدام الأدوات والأساليب من أجل التعامل مع 
صحة البيانات الضخمة وذلك عن طريق تحويل إلى بيانات ذات جودة عالية وجديرة بالثقة. 

القابلية للتغيير: فضلًا عن تزايد السرعات والتنوع في البيانات» يمكن أن تكون تدفقات البيانات 
غير متسقة بدرجة كبيرة مع القمم الدورية. هل هناك شيء كبير يتجه نحو وسائل التواصل 
الاجتماعي؟ رها يكون هناك 120 (طرح عام مبدي) رفيع المستوى يلوح في الأفق. وربما تصبح 
السباحة مع الخنازير في جزر البهاما فجأة نشاطًا واجب الأداء أثناء العطلة. كما يمكن أن تكون 
الأحمال القصوى للبيانات اليومية وا موسمية والناجمة عن الحدث متغيرة إلى حد كبير JS lea‏ 
تحديًا للإدارة - خاصة مع وسائل التواصل الاجتماعي المعنية. 

عرض القيمة: تتمثل الإثارة حول البيانات الضخمة في عروض القيمة الخاصة بها. أما الفكرة 
المسبقة حول البيانات «الضخمة» فتتمثل في كونها تحتوي (أو لديها قدرة أكبر على احتواء) ا مزيد 
من الأنماط والأشكال المثيرة للاهتمام أكثر من البيانات «الصغيرة». وبالتاليء فإن المنظمات يمكنها 
أن تكتسب قيمة تجارية أكبر من خلال تحليل البيانات الضخمة والغنية بالميزات» والتي قد لا 
يمكنها أن تكتسبها بطريقة أخرى. وعلى الرغم من أن المستخدمين هكنهم اكتشاف الأماط à‏ 
مجموعات البيانات الصغيرة من خلال استخدام أساليب إحصائية بسيطة وطرق تعلّم الآلة أو 
أدوات طلب البحث وإعداد التقارير المخصصة: إلا أن البيانات الضخمة تعني تحليلات «ضخمة». 
وتعني التحليلات الضخمة رؤية أكبر وأشياء وقرارات أفضلء والتي تحتاج إليها كل منظمة. 

ومن المرجح أن تتم إضافة المزيد من الخصائص (ربما تكون المزيد من ”۷“) إلى تلك القائمة, 
وذلك نظرًا لكون التعريف الدقيق للبيانات الضخمة (أو بنودها اللاحقة) لازال مطروحًا للمناقشة 
المستمرة في الدوائر الأكاديمية والصناعية. وبغض النظر عما يحدثء فإن أهمية وعرض قيمة البيانات 
الضخمة وُحِدَّت لتبقى. ويعرض الشكل (۳-۷) بنية مفاهيمية حيث يتم تحويل البيانات الضخمة 
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(الموجودة في الجانب الأيسر من الشكل) إلى رؤية عملية من خلال استخدام مزيج من التحليلات 
المتقدمة وتقدهها لمجموعة متنوعة من المستخدمين / الأدوار المختلفة لاتخاذ قرارات أسرع / أفضل. 




















SOURCE: ASTERDATA-A TERADATA COMPANY. 
شكل 8-7: بنية مفاهيمية عالية المستوى لحلول البيانات الضخمة‎ 
وهناك مصطلح آخر تتم إضافته إلى الكلمات الطنانة للبيانات الضخمة وهو مصطلح البيانات‎ 
لأنواع متعددة من البيانات في‎ ilia (V-V) åa Ilol >g „alternative data iLa 
عدد من السيناريوهات المختلفة.‎ 


حالة عملية 1-۷ 
بيانات بديلة لتحليلات أو توقعات السوق 

يُعد الحصول على توقعات جيدة وفهم الوضع بشكل جيد أمرًا ضروريًا لأي سيناريوه 

إلا أنه مهم بشكل خاص لمثلي صناعة الاستثمار. كما أن إمكانية حصول المستثمر على 

مؤشر مبكر لكيفية عمل مبيعات معينة لمتاجر التجزئة من ا ممكن أن تمنحه قانئمة حول 

شراء أو بيع أسهم هذا البائع حتى قبل أن تصدر تقارير الأرباح. وتّعد مشكلة التنبؤ 
Sources: Higginbotham, S. (2012). As data gets bigger, what comes after a yottabyte? gigaom.‏ 
com/2012/10/30/as-data-gets-bigger- what-comes-after-a-yottabyte (accessed August 2016). Cisco.‏ 


(2016). The zettabyte era: Trends and analysis. cisco.com/c/en/us/solutions/collateral/service-provider/ 
visualnetworking- index-vni/vni-hyperconnectivity-wp.pdf (accessed August 2016). 


MA‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


مفاهيم وأدوات البيانات الضخمة 


بالنشاط الاقتصادي أو المناخ المحلي الذي يعتمد على مجموعة متنوعة من البيانات بخلاف 
بيانات التجزئة المعتادة هي ظاهرة حديثة جدًا كما أنها أدت إلى ظهور عبارة أخرى طنانة 
وهي «البيانات البديلة». ويُّعد المزيج الرئيس في هذه الفئة من البيانات البديلة هو صور 
الأقمار الصناعية» غير أنه يتضمن أيضَّا بيانات أخرى مثل وسائل التواصل الاجتماعيء أو 
الإيداعات الحكومية» أو إعلانات الوظائفء أو أنماط حركة ال مرورء أو التغييرات في مواقف 
السيارات أو المساحات المفتوحة التي اكتُشقّت من خلال صور الأقمار الصناعية. بالإضافة 
إلى أماط استخدام الهاتف المحمول في أي موقع محدد خلال أي وقت محدد. وأنماط 
البحث على محركات البحثء وغير ذلك. وقد قامت شركة فيسبوك وغيرها من الشركات 
بالاستثمار في الأقمار الصناعية محاولةٌ تصوير العالم كله بشكل يومي بحيث تتمكن من 
تعقب التغييرات اليومية في أي مكان ومن ثم استخدام المعلومات من أجل التنبؤ. وقد 
ورد العديد من الأمثلة المثيرة للاهتمام لتنبؤات متقدمة وموثوقة بدرجة عالية. وفي 
الواقع» فإن هذا النشاط تقوده شركات ناشئة. وفيما يلي بعض الأمثلة: 

- استخدام 146600016 محرك التعرف على الصور من أجل تحليل أكثر من ١4,7‏ مليار 
صورة بغرض تحليل كل ركن من أركان العام لتحديد المناطق ذات الاتصال المنخفض. 

Metrics 4 $55 c. il; -‏ 15 مواقف السيارات عبر الولايات المتحدة من خلال 
صناديق الاستثمار المختلفةء حيث توقعت شركة زا۷ ۸8 تحقيق أرباح قوية في 
الربع الثاني من عام ۲١٠١‏ لصالح [٤ ۲٠٣٠٠,‏ وقد اعتمدت الشركة في توقعاتها على 
تحليل مواقف السيارات. وقد استفاد عملاؤها (في الغالب عملاء صناديق الاستثمار) من 
هذه الرؤية المتقدمة. وقد وردت قصة أخرى مشابهة Cuiul gilly Wal-Mart J‏ 
أعداد السيارات الموجودة في مواقف السيارات الخاصة بها من أجل توقع المبيعات. 

- قيام شركة كاطع أ5م1 01121 بتوفير مؤشرات الاقتصاد الكني لقطاعات الصناعة 
المختلفة من خلال استخدام بيانات صور الأقمار الصناعية. فعلى سبيل المثالء 533( 
الشركة أنها أنتجت تقديرات يومية أفضل مما هو متاح الآن من وكالة الطاقة الدولية 
(184) من أجل تخزين النفط في جميع أنحاء العالم. وقد استطاعت فعل ذلك من خلال 
dalos‏ صهاريج تخزين النفط حول العام. 

- تتبع شركة 50201201 للتغيرات في محيط ا مصنع لأكثر من ٠٠٠١‏ موقع مصنع 
صيني. وقد تمكنت الشركة باستخدام هذه البيانات» من تقديم فكرة عن النشاط الاقتصادي 
الصناعي للصينء وقد كانت هذه الفكرة أفضل بكثير مما قدمته الحكومة الصينية. 
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- استخدام معامل 126562565 لبيانات الأقمار الصناعية من أجل التنبؤ بحصاد الذرة 
في الولايات المتحدة بدقة أكبر من وزارة الزراعة الأمريكية. فالتنبؤات الأفضل قد يكون 
لها آثار مالية ضخمة على تداول العقود الآجلة. ومن أقدم الأمثلة على ذلك مثال لإحدى 
الشركات تُسمى 1325001080 والتي تنبأت أيضًا بتقديرات محاصيل الذرة. وقد قامت شركة 
Lanworth 4$ 43 «li: Thomson Reuters‏ ثم دمجتها في خدمة ٤k٥١‏ الخاصة بهم. 

- قدرة شركة 1]2161006ع1(1 على تحليل حجم الغابة بمزيد من الدقة نظرًا لقدرة 
برنامجها على عد كل شجرة في الغابة, مما يؤدي إلى تقدير أكثر دقة نظرًا لأنه لا توجد 
حاجة لاستخدام عينة تمثيلية. 

- قيام شركة Kensho‏ بالاستفادة من تحليل البيانات من مصادر متعددة (ذُكرت 
سابقًا) من أجل بناء محرك تجاريء وذلك بدعم من شركة و52 مددمل1ه6. 

وقد أعطت هذه الأمثلة مجرد عينة من الطرق التي يمكن بها جمع البيانات من أجل 
إنشاء أفكار جديدة. وبالطبع, فإنه في بعض الحالات يكون هناك بعض المخاوف التي 
تتعلق بالخصوصية. فعلى سبيل المثالء ذكرت صحيفة ]556 18/211 في عام ٠٠١١0‏ قصة 
Yodlee 4542)‏ وهي شركة توفر أدوات التمويل الشخصي لعدد من البنوك الكبيرة ومن 
ثم فإن الشركة يمكنها الوصول إلى ملايين من معاملات بطاقات الائتمان الخاصة بالعملاء 
وتقوم ببيع هذه البيانات إلى شركات تحليلات أخرى والتي يمكنها استخدام هذه المعلومات 
من أجل تطوير تنبؤات مبكرة حول كيفية اتجاه المبيعات نحو بائع تجزئة معين. 

وهذه المعلومات مطلوبة بشكل كبير من قبل متعاملي سوق الأوراق المالية. وقد 
أدت هذه القصة إلى حدوث ضجة كبيرة بسبب استخدام المعلومات الخاصة بالعملاء 
بطرق غير مصرح بها. أيضّاء فإن هناك قلقًا في بعض الدوائر حول مشروعية وضع مثل 
هذه التنبؤات المتقدمة حول سلعة معينة أو شركة معينة. وعلى الرغم من أن جميع 
هذه المخاوف سيتم حلها في نهاية المطاف من قبل صانعي السياسات. إلا أنه من الواضح 
أن الطرق الجديدة وامثيرة للاهتمام والتي تُستخدم للجمع بين بيانات الأقمار الصناعية 
والعديد من مصادر البيانات الأخرى ينتج عنها ظهور مجموعة جديدة من شركات 
التحليلات. حيث تعمل جميع هذه المنظمات مع البيانات التي تتوافق مع مواصفات 
الثلاث (V's)‏ وهي تنوع العناصر وحجمها وسرعاتها. وبالإضافة إلى ذلك. فإن بعض 
هذه الشركات تعمل أيضًا مع فئة أخرى من البيانات وهي أجهزة الاستشعارء والتي 
سنقوم بمناقشتها في الفصل التالي عندما نستعرض الاتجاهات الناشئة في التحليلات. غير 
أن هذه الشركات تقع ضمن مجموعة من التطبيقات المبتكرة والناشئة. 
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-١‏ ما هو العامل المشترك في الأمثلة التي تناولناها بالمناقشة في هذه الحالة العملية؟ 
۲- هل هكنك التفكير في تدفقات البيانات الأخرى التي قد تساعد في إعطاء دلالة 
مبكرة للمبيعات في متاجر التجزئة؟ 
da -Y‏ كنك التفكير في تطبيقات أخرى تحاكي الطرق التي تم عرضها في هذه الحالة العملية؟ 
Sources: Dillow, C. (2016). What happens when you combine artificial intelligence‏ 
and satellite imagery. fortune.com/201630/03//facebook-ai-satellite-imagery/‏ 
(accessed July 2016). Ekster, G. (2015). Driving investment performance with‏ 
alternative — data. — integrity-research.com/wp-content/uploads/20151 1//Driving-‏ 
Investment-Performance-With-Alternative-Data.pdf (accessed July 2016). Hope, B.‏ 
Provider of personal finance tools tracks bank cards, sells data to investors.‏ .)2015( 
wsj.com/articles/providerof-personal-finance-tools-tracks-bank-cards-sells-data-to-‏ 
investors-1438914620 (accessed July 2016). Orbital Insight. World Oil Storage Index.‏ 
orbitalinsight.com/solutions/world-oil-storage-index/(accessed July 2016). Shaw,‏ 
C. (2016). Satellite companies moving markets. quandl.com/blog/alternative-data-‏ 
satellite-companies (accessed July 2016). Steiner, C. (2009). Sky high tips for crop‏ 
traders. — http://www.forbes.com/forbes/20090907//technology-software-satellites-‏ 
sky-high-tipsfor-crop-traders.html (accessed July 2016). Turner, M. (2015). This is‏ 
the future of investing, and you probably can't afford it. businessinsider.com/hedge-‏ 
funds-are-analysing-data-to-get-an-edge-20158- (accessed July 2016).‏ 


أسئلة للمراجعة على القسم ۲-۷: 

-١‏ اذا تعتبر البيانات الضخمة مهمة؟ وما الذي تغير ليتم وضعها في مركز عام التحليلات؟ 

۲- عرف البيانات الضخمة. وطاذا يصعب تعريفها؟ 

-Y‏ ما هو أصل ”۷“ التي تستخدم لتعريف البيانات الضخمة, وأي منها يعتبر الأكثر أهمية في 
رأيك؟ وماذا؟ 

-٤‏ ما رأيك في مستقبل البيانات الضخمة؟ وهل من الممكن أن تترك شهرتها لشيء آخر؟ وإذا كان 
الأمر كذلك. فماذا سيكون هذا الشيء؟ 
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۳-۷ أساسيات تحليلات البيانات الضخمة: 
لا قيمة للبيانات الضخمة بحد ذاتها - بغض النظر عن حجم هذه البيانات» أو نوعهاء أو 
سرعتها - مام يقم مستخدمو الأعمال بعمل شيء ما يعطي قيمة لمنظماتهم. وهنا تظهر في الصورة 
التحليلات ”الضخمة“. وعلى الرغم من قيام المنظمات دائما بتشغيل التقارير ولوحات المعلومات 
ضد مستودعات البيانات» إلا أن معظمها لم يفتح هذه المستودعات لإجراء استكشاف متعمق 
حسب الطلبء وهذا يرجع بشكل جز إلى التعقيد الشديد لأدوات التحليل بالنسبة للمستخدم 
العاديء كما يرجع أيضًا إلى أن اللمستودعات في الغالب لا تحتوي على جميع البيانات اللازمة 
للمستخدم القويء غير أن كل ذلك على وشك التغيير بطريقة مثيرة (وبالفعل تم تغيير البعض)» 
وذلك بفضل النموذج الجديد لتحليلات البيانات الضخمة. 
وعلى الرغم من عرض قيمة البيانات الضخمة» غير أنها تسببت أيضًا في تحديات كبيرة للمنظمات» 
حيث إن الوسائل التقليدية لالتقاط وتخزين وتحليل البيانات غير قادرة على التعامل بفاعلية 
وكفاءة مع البيانات الضخمة. ولذلك؛ فإن السلالات الجديدة للتقنيات ينبغي تطويرها (أو شراؤها 
/ استخدامها / الاستعانة بمصادر خارجية) من أجل مواجهة تحديات البيانات الضخمة. كما ينبغي 
على المنظمات قبل اتخاذ أي خطوات في هذا الاستثمار أن تبين أسباب استخدام مثل تلك الوسائل. 
وفيما يلي نذكر بعض الأمثلة التي قد تساعد في تسليط الضوء على هذه الحالة. واعلم أنك ستكون 
بحاجة للتفكير الجاد في الإبحار في رحلة البيانات الضخمة في حال تحقٌّق إحدى الحالات التالية: 
- إذا كنت لا تستطيع معالجة مقدار البيانات التي تريدها بسبب المحددات المفروضة من 
نظامك الحالي أو البيئة الحالية. 
- إذا كنت تريد تضمين مصادر بيانات جديدة / معاصرة (مثل: وسائل التواصل الاجتماعي» 
الحسبّةء الويبء 625 البيانات النصية) في منصة البيانات الخاصة بك غير أنك لا 
تستطيع ذلك نظرًا لعدم توافقها مع الصفوف والأعمدة المحددة في مخطط مستودعات البيانات 
دون التضحية بثبات أو ثراء البيانات الجديدة. 
- أن تكون في حاجة إلى (أو ترغب في) دمج البيانات بأسرع ما يمكن لتتوافق مع تحليلاتك. 
- أن تكون لديك رغبة في العمل بمخطط حسب الطلب (بدلًا من المخطط المحدد سلقًا والذي 
يُستخدم في أنظمة إدارة قواعد البيانات ذات الصلة [11083455]) لأن طبيعة البيانات الجديدة 
قد لا تكون معروفة, أو قد لا يكون هناك متسع من الوقت لتحديد ذلك وتطوير المخطط له. 
- وصول البيانات إلى منظمتك بصورة سريعة» بحيث لا تستطيع منصة التحليلات التقليدية التعامل معها. 
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وكما هو الحال مع أي استثمار كبير في مجال تقنية المعلومات» فإن النجاح في تحليلات البيانات 
الضخمة يعتمد على عدد كبير من العوامل. ويعرض الشكل (ل-6) تصويرًا بيانيًا لأكثر عوامل 
النجاح أهمية )2012 .(Watson,‏ 











شكل :٤-۷‏ عوامل النجاح لتحليلات البيانات الضخمة 


وفيما يلي أهم عوامل نجاح تحليلات البيانات الضخمة & Watson, Sharda,‏ 
:(Schrader, 2012‏ 





-١‏ وضوح احتياجات الأعمال (بحيث تتوافق مع الرؤية والإستراتيجية): فالاستثمارات في الأعمال 
ينبغي أن تتم لصالح العملء وليس للجرد التقدم بمجال التقنية. ولذلك؛ فإنه ينبغي أن 
تكون احتياجات الأعمال هى المحرك الرئيس لتحليلات البيانات الضخمة على كل المستويات: 
الإستراتيجي» والتكتيي. بالإضافة إلى التشغيلي. 

۲- رعاية قوية. ملتزمة (بطل تنفيذي): فمن ا معروف جيدًا أنه من الصعب (إن لم يكن مستحيكًا) 
تحقي ق النجاح» إذا م يكن لديك رعاية ودعم تنفيذي قوي وملتزم. هذه الرعاية هكن آن 
تكون على مستوى الإدارات» وذلك في حالة إذا كان المدى عبارة عن تطبيق تحليلي فردي أو 
عدد قليل من التطبيقات التحليلية. ومع ذلكء فإنه في حالة ما إذا كان الهدف هو التحول 
التنظيمي على نطاق المؤسسةء وهو ما يحدث في كثير من الأحيان مبادرات البيانات الضخمة 
فينبغي أن تكون الرعاية على أعلى المستويات كما ينبغي أن يكون التنظيم واسع النطاق. 
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۴- التوافق بين الأعمال وإستراتيجية تقنية المعلومات: فمن الضروري التأكد من أن العمل 
التحليلي يدعم دائمًا إستراتيجية العمل وليس العكس. وينبغي أن تلعب التحليلات الدور 
التمكيني في تنفيذ إستراتيجية الأعمال بنجاح. 

4- ثقافة صنع القرار المبني على الحقيقة: في ثقافة صنع القرار المبني على الحقيقة» يكون الاعتماد 
على الأرقام بدلا من الحدسء أو الشعور الغريزيء أو افتراض عملية صنع القرار. وهناك أيضًا 
ثقافة التجريب لمعرفة ما يصلح ومالا يصلح. ولإنشاء هذه الثقافة تحتاج الإدارة العليا إلى: 
- إدارك أن بعض الأشخاص لا يمكنهم أو لن يقوموا بضبط ذلك. 
- أن تكون Égo sel»‏ 

- التأكيد على ضرورة وقف الأساليب القدهة. 
- أن تطلب معرفة أي التحليلات دخلت في القرار. 
- أن تربط الحوافز والمكافأت بالسلوكيات المرغوبة. 

0- بنية تحتية قوية للبيانات: قدمت مستودعات البيانات البنية الأساسية للبيانات من أجل 
التحليلات. وفي عصر البيانات الضخمة فإن هذه البنية الأساسية يتم تغييرها وتعزيزها 
باستخدام تقنيات جديدة. حيث يتطلب النجاح أن يتم الجمع بين القديم والجديد من أجل 
بنية أساسية شاملة تعمل بصورة تآزرية. 

وتزداد الحاجة إلى أنظمة تحليلية أكثر كفاءة. كلما ازداد الحجم والتعقيد. وقد تم تطوير 
عدد من التقنيات الحسابية والمنصات المبتكرة والجديدة. من أجل مواكبة الاحتياجات الحسابية 
للبيانات الضخمة. وهذه التقنيات مجتمعةً تسمى الحوسبة عالية الأداءء والتي تتضمن ما يلي: 
- تحليلات داخل الذاكرة: وهي تقوم بحل المشاكل المُعقدة فور حدوثها تقريبًا بأفكار عالية 
الدقة من خلال السماح بمعالجة وتوزيع الحسابات التحليلية والبيانات الضخمة في الذاكرة عبر 
مجموعة مخصصة من العقد. 

- تحليلات داخل قاعدة البيانات: وتعمل على توفير الوقت للأفكار وتمكين إدارة البيانات بشكل 
أفضل من خلال إجراء تكامل للبيانات والوظائف التحليلية داخل قاعدة البيانات بحيث لا 
تضطر إلى نقل البيانات أو تحويلها بشكل متكرر. 

- الحوسبة الشبكية: وتعمل على رفع الكفاءة. وخفض التكلفةء وتحسين الأداء عن طريق معالجة 
الوظائف بشكل مشترك تتم إدارته مركزيًا من قبل موارد تقنية ا معلومات. 

- الوسائل: يتم الجمع بين الأجهزة والبرامج في وحدة مادية لا تتسم بالسرعة فقطه بل هي أيضًا 
قابلة للتطوير على حسب الحاجة. 
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وتمثل المتطلبات الحاسوبية مجرد جزء صغير من قائمة التحديات التي تفرضها البيانات 

الضخمة على مشروعات اليوم. وقد عثر مديرو الأعمال التنفيذيون على تحديات ذات تأثير كبير 

على التنفيذ الناجح لتحليلات البيانات الضخمة. وعند النظر في مشاريع وأساليب بناء البيانات 

الضخمة: فإن التنبه لهذه التحديات سوف يجعل رحلة تحليلات الكفاءة أقل إرهافًا. وفيما يلي 

قائمة بهذه التحديات: 

- حجم البيانات: القدرة على جمع. وتخزينء ومعالجة حجم ضخم من البيانات بسرعة ملائمة 
حيث تكون أحدث المعلومات متاحة لصانعي القرار في حالة حاجتهم إليها. 

- تكامل البيانات: القدرة على الجمع بين البيانات غير متشابهة الهيكل أو المصدر مع مراعاة أن 
يتم عمل ذلك بسرعة وبتكلفة معتدلة. 

- إمكانات المعالجة: القدرة على معالجة البيانات بسرعة. بمجرد وجودهاء حيث إن الطريقة 
التقليدية لجمع ومعالجة البيانات ربما لا تؤدي العمل المطلوب. ولذلك؛ فإنه في العديد من 
الحالات» ينبغي تحليل البيانات بمجرد الحصول عليها للاستفادة من أكبر قدر ممكن من قيمتها 
(وهذا ما يسمى بتحليلات التيارء والتي سوف نتناولها لاحقًا في هذا الفصل). 

- التحكم في البيانات: القدرة على حفظ الأمنء والسرية» وحقوق الملكيةء وجودة البيانات 
الضخمة. وينبغي أن تتناسب قدرات ممارسة التحكم مع حجم تغيير البيانات» وتنوعها (في 
التنسيق والمصدر)» وسرعتها. 

- توافر المهارات: يتم استغلال البيانات الضخمة من خلال استخدام أدوات جديدة كما يتم البحث 
عنها بطرق مختلفة. وهناك نقص في الأشخاص (الذين يطلق عليهم غالبًا علماء البيانات) ذوي 
المهارات اللازمة للقيام بهذه المهمة. 

- تكلفة الحل: هناك قدرٌ كبيرٌ من التجارب والاكتشافات التي تجري لتحديد أنماط هذه المسألة 
والأفكار التي تتحول إلى قيمة. وذلك بسبب ما قدمته البيانات الضخمة من تحسينات الأعمال 
الممكنة. ولضمان تحقيق عائد إيجابي على الاستثمار في مشروع البيانات الضخمة: فإنه من 
الضروري تقليل تكلفة الحلول المستخدمة لإيجاد تلك القيمة. 

وكما أن التحديات حقيقية فإن عرض قيمة تحليل البيانات الضخمة يكون أيصًا كذلك. وأي شيء 

يمكنك القيام به باعتبارك قائد لتحليل الأعمال من أجل المساعدة في إثبات قيمة مصادر البيانات 

الجديدة بالنسبة إلى الأعمالك سوف ينقل مؤسستك إلى ما هو أكثر من مجرد تجريب واستكشاف 

البيانات الضخمة في تكييفها وتبنيها باعتبارها شيئًا مختلقًا. ولا يوجد شيء خاطنئ مع الاستكشافء غير 

أن القيمة تأي في نهاية ا مطاف من وضع تلك الأفكار موضع التنفيذ. 
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مشاكل الأعمال التي تم علاجها من خلال تحليلات البيانات الضخمة: 
تتمثل أهم مشالل الأعمال التي تتم معالجتها عن طريق البيانات الضخمة بوجه عام في 
كفاءة العمليات وتخفيض التكاليفء بالإضافة إلى تعزيز تجربة العملاء غير أنه عندما يتم النظر 
إليها من منظور قطاع الصناعة فإن هناك أولويات مختلفة تظهر. وربما تكون كفاءة العمليات 
وتخفيض التكلفة مصنفة من ضمن المشكلات ذات المستوى الأعلى والتي يمكن معالجتها باستخدام 
تحليلات البيانات الضخمة لقطاعات التصنيعء والحكومة. والطاقة والمرافق» والاتصالات والإعلام» 
والنقل والرعاية الصحية. كما أن تعزيز تجربة العملاء قد تكون على رأس قائمة المشكلات التي 
تعالجها شركات التأمين. وبالنسبة للشركات في القطاع المصرفي والتعليم فإنه عادةٌ ما تكون 
إدارة المخاطر على رأس القائمة. وفيما يلي قانئمة جزئية بالمشاكل التي يمكن معالجتها باستخدام 
تحليلات البيانات الضخمة: 
- كفاءة العملية وخفض التكلفة. 
- إدارة العلامة التجارية. 
- تعظيم العائد, والبيع المتقاطع؛ والبيع من خلال وسطاء. 
- تجربة العملاء المحسنة. 
- تحديد هوية تحول العملاء والمحافظة على العملاء. 
- خدمة العملاء المحسنة. 
- تحديد المنتجات الجديدة وفرص السوق. 
- إدارة المخاطر. 
- الامتثال للوائح التنظيمية. 
- إمكانات الأمان المحسنة. 
وتضرب الحالة العملية (1-؟) مثالا ممتارًاً للصناعة المصرفيةء حيث يتم تكامل المصادر المختلفة 
للبيانات مع البنية الأسأسية للبيانات الضخمة من أجل التوصل إلى مصدر واحد للحقيقة. 
حالة عملية Y-V‏ 
بنك توب jas d| dogi! ṣi (Top Five Investment) Sasia) A‏ 
واحد للحقيقة 
يعتبر فريق مشتقات البنك الذي يحظى بالاحترام الفائق مسؤولًا عن أكثر من ثلث 
إجمالي تجارة المشتقات في العالم. كما أن ممارسة هذا الفريق للمشتقات لها بصمة 
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عالمية في مقابل الفرق التي تدعم الائتمانء ومعدلات الفائدة. ومشتقات الأسهم في كل 
منطقة من مناطق العام. وقد حصل البنك على العديد من الجوائز في مجال الصناعة 
والمُعترف بها لابتكارات منتجاتها. 

التحدي: 

وقد أدركت إدارة البنك بتعرضها للمشتقات المهمة. أهمية وجود رؤية عاللطية 
في الوقت المناسب لواقعها. وقد تألف النظام الحاليء والذي يستند على قاعدة 
بيانات علائقيةء من العديد من المنشآت حول العام. وبسبب التوسعات التدريجية 
من أجل استيعاب تزايد أنواع حجم البيانات» فإن النظام القديم م يكن سريعًا بما 
يكفي ليلبي احتياجات ومتطلبات العمل المتزايدة. حيث م يتمكن هذا النظام من 
تقديم تنبيهات في الوقت المناسب لإدارة السوق والمناصب الاثتمانية المناظرة في الإطار 
الزمني المرغوب فيه. 

الحل: 

قام البنك ببناء متجر للمشتقات التجارية بناءَ Jgl> 3399) MarkLogic ds‏ 
تحليلات بيانات ضخمة)ء لتحل محل التقنيات الحالية. وقد تمكن البنك من معرفة 
وضعه في السوق ووضعه الائتماني في الوقت المناسبء وذلك من خلال استبدال خوادم 
معالجة الدفعات المختلفة العشرين بمخزن تجاري واحد جاهز للتشغيلء مما وفر 
القدرة على التصرف بسرعة للحد من المخاطر. وقد سمحت دقة واكتمال البيانات 
للبنك وجهاز التنظيم الخاص به. بالاعتماد بشكل واثق على المقاييس ونتائج اختبار 
الضغط التي يقدمها. 

وقد اشتملت عملية الاختيار على ترقية Sybase 4,55 Oracle à 185 a J$‏ 
الحاليتينء بالإضافة إلى الوفاء بجميع المتطلبات التنظيمية الجديدة والذي يُعد عاملًا 
رئيسًا في اتخاذ القرار فقد كان البنك يتطلع إلى زيادة استثماراته إلى أقصى حد. وقد كان 
الخيار واضحًا بعد التحقيق الدقيق الذي أجراه البنك. فلم يتمكن أي من الخوادم من 
تلبية كلا الحاجتين فضلًا عن توفير أداء أفضلء وقابلية التوسع, وتطوير أسرع للمتطلبات 
المستقبلية والتنفيذية» وتكلفة إجمالية أقل لحقوق الملكية. سوى عنهه.1!:ة21 فقط 
والذي استطاع أن يفي بكل ذلك. ويوضح الشكل )٥-۷(‏ التحويل من الأنظمة اممجزأة 
القدهة إلى النظام ا موحد الجديد. 
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(نسخ منفصلة لمغزن تجارة المشتقفت) 
بعد : أصبح من الممكن تحليل جميع العقود فى 
قاعدة بيانات منفردة (يقوم خادم 

marklogic 
بازالة الحلجة إلى 20 نسخة من قاعدة البياقات)‎ 

















Sources: MarkLogic. 


شكل 0-۷: الانتقال من عدة أنظمة قدهة إلى نظام جديد موحد 


النتائج: 

وقع الاختيار على ءذع142:11.0 نظرًا ما يوفره من تحديث لجزء من الثانية, بالإضافة 
إلى أوقات الاستجابة للتحليل اللازمة لإدارة سجل تجارة المشتقات بشكل فعال والذي 
يمثل ما يقرب من ثلث السوق العالميء في حين أن النظم الحالية لن تقدم ذلك. والآن 
يتم تجميع البيانات التجارية بدقة من خلال ملف مشتقات البنك بالكاملء مما يسمح 
لأصحاب المصلحة بإدارة المخاطر بمعرفة ملف ا مخاطر الحقيقي للمؤسسة:. لإجراء 
التحليلات التنبؤية باستخدام بيانات دقيقة. ولاعتماد نظرة تطلعية. ولا يقتصر الأمر 
على توفير مئات آلاف الدولارات من تكاليف التقنية كل ele‏ بل إن البنك لا يحتاج إلى 
إضافة موارد للوفاء بالمطالب المتزايدة للهيئات التنظيمية من أجل مزيد من الشفافية 
وتكرار اختبار الضغط. وفيما يلي أهم العناصر: 

- تعمل ميزة التنبيه على إبقاء المستخدمين على دراية فورية بتغييرات السوق 
والتغييرات الاثتمانية لنظرائهم حتى يتمكنوا من اتخاذ الإجراءات المناسبة. 

- يتم تخزين المشتقات وتداولها في نظام عزع3/:11.0 فردي ولا يتطلب أي توقف 
للصيانةء مما يعطيه ميزة تنافسية كبيرة. 

- يمكن إجراء تغييرات معقدة خلال ساعات في حين أن الخوادم الأخرى تستغرق 
أيامًا وأسابيع بل وقد تصل إلى أشهر. 
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d] Sybaseg Oracle Jlis gof -‏ خفض تكاليف العمليات بشكل كبير حيث أنه 
يوفر: نظام واحد مقابل ۲١‏ نظامًاء ومسؤول قاعدة بيانات واحد بدلا من ٠١‏ بالإضافة 
إلى انخفاض تكاليف كل عملية تداول. 

الخطوات التالية: 

أدى النجاح في تنفيذ النظام الجديد وأدائه إلى فحص البنك ناطق أخرى حيث 
يمكنه أن يستخلص قيمة أكبر من بياناته الضخمة المهيكلة, أو غير المهيكلة, و / أو 
المتسلسلة. وهناك تطبيقان قيد المناقشة النشطة. حيث ترى أعمال أبحاث الأسهم 
الخاصة بهم فرصة لزيادة الإيرادات بشكل كبير من خلال نظام أساسي يوفر الأبحاث في 
الوقت المناسب» كما يوفر إعادة التهيئةء فضلًا عن المحتوى. كما يرى البنك أيضًا قوة 
مركزية بيانات العملاء في تحسين الإعداد. وزيادة فرص البيع المتقاطع: ودعم اعرف 
متطلبات عميلك. 

أسئلة للمناقشة: 

-١‏ كيف يكن الاستفادة من البيانات الضخمة ف البنوك التجارية على نطاق واسع؟ 

۲ كيف ساعدت البنية الأساسية ل ءأعه] ۸ة في تسهيل الاستفادة من البيانات الضخمة؟ 

- ما هي التحدياتء والحل المقترح, والنتائج التي تم التوصل إليها؟ 

investment bank achieves single 0 Top .(Y-WY) .Sources: MarkLogic 
derivativestrading--0-source of truth. marklogic.com/resources/top 


Y Y1 bank-achieves-single-source-of-truth (accessed July 
:۳-۷ أسئلة للمراجعة على القسم‎ 
ما هي تحليلات البيانات الضخمة؟ وكيف تختلف عن التحليلات المنتظمة؟‎ -١ 
ما هي عوامل النجاح ذات الأولوية لتحليلات البيانات الضخمة؟‎ -۲ 
ما هي التحديات الكبيرة التي ينبغي مراعاتها عند اعتماد تنفيذ تحليلات البيانات الضخمة؟‎ - 
ع- ما هي مشاكل العمل الشائعة التي تم علاجها بواسطة تحليلات البيانات الضخمة؟‎ 


٠-۷‏ تقنيات البيانات الضخمة: 


هناك عدد من التقنيات لمعالجة البيانات الضخمةء غير أن معظمها لها بعض الخصائص ال مشتركة 
(2012 رزلاء»1). وهذا يعني أنهم يستفيدون من الأجهزة السلعية لتمكين أساليب التدريج والتعامل 
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المتوازي؛ واستخدام قدرات مستودعات البيانات غير الارتباطية لمعالجة البيانات غير المهيكلة وشبه 
المهيكلة؛ وتطبيق تقنية متقدمة للتحليلات والتصوير البصري للبيانات الضخمة من أجل نقل الأفكار إلى 
ا مستخدمين النهائيين. وتتمثل تقنيات البيانات الضخمة الثلاثة البارزة g Hadoopg MapReduce ġ‏ 
1 والتي يُعتقد أنها على الأغلب سوف تحول تحليلات الأعمال وأسواق إدارة البيانات. 


:MapReduce 
عن طريق جوجلء والذي يقوم بتوزيع معالجة ملفات البيانات‎ Lais Goli MapReduce ssi 
الضخمة متعددة الهيكلة عبر مجموعة كبيرة من الآلات. ويتم تحقيق الأداء العالي عن طريق تقسيم‎ 
المعالجة إلى وحدات صغيرة من العمل التي يمكن تشغيلها بالتوازي عبر المئات» بل قد تكون عبر الآلافء‎ 

من العقد في مجموعة الآلات تلك. وفيما يلي اقتباس الوثيقة المهمة áilszll‏ ب :MapReduce‏ 
إن MapR duce‏ هو نمموذج برمجة وتنفيذ مترابط معالجة وتوليد مجموعات 
البيانات الضخمة. حيث تتم موازنة البرامج المكتوبة على هذا النمط الوظيفي تلقائيًا 
وتنفيذها على مجموعة كبيرة من آلات المادة. الجدير بالذكر أن استخدام مثل هذه 
الأنظمة المتوازية والموزعة يسمح للمبرمجين الذين ليس لديهم أي خبرة بالاستفادة 
بسهولة من موارد نظام التوزيع الكبير. )2004 „(Dean & Ghemawat,‏ 
وتتمثل النقطة الأساسية التي ينبغي ملاحظتها من هذا الاقتباس في MapReduce of‏ يُعد 
نموذج برمجةء وليس لغة برمجةء وهذا يعني أنه مصمم ليتم استخدامه من قبل المبرمجين» وليس 
مستخدمي الأعمال. ولوصف كيفية عمل ipis pgäiu däs yb Jaub MapReduce‏ مثال. 
انظر عداد المربعات الملونة عهنو00105605 في الشكل (1-1). 
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شكل 1-۷: تصوير بياني لعملية Mapreduce‏ 
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لاحظ في هذا الشكل أن المدخلات إلى عملية ع160106م212 هي عبارة عن مجموعة من 
المربعات اللملونة. والهدف هو حساب عدد مربعات كل لون. وفي هذا المثال يكون المبرمج 
مسؤولًا عن ترميز الخريطة والتقليص من البرامج؛ وما يتبقى من المعالجة يتم التعامل معها من 
خلال نظام البرمجيات الذي ينفذ £534 -MapReduce åra,‏ 

حيث يقوم نظام 1606م 112 أولّا بقراءة ملف المدخلات وتقسيمه إلى عدة أجزاء. وفي هذا 
المثال هناك نوعان من التقسيمات» بينما على أرض الواقع؛ ole‏ ما يكون عدد التقسيمات أعلى من 
ذلك بكثين ومن ثم تتم معالجة هذه التقسيمات عن طريق برامج 1025 المتعددة والتي تعمل 
بالتوازي على عقد المجموعة. وفي هذه الحالة يكون دور كل برنامج هو تجميع وتقسيم البيانات 
حسب اللونء ثم يقوم نظام dsl, MapReduce‏ مخرجات کل برنامج ودمج (خلط / فصل) نتائج 
المدخلات إلى برنامج التقليص, والذي يقوم بحساب مجموع عدد المربعات لكل لون. وفي هذا الثاله 
يتم استخدام نسخة واحدة فقط من برنامج التقليصء غير أنه من الناحية العملية قد يكون هناك 
المزيد من النُسخ. ومكن للمبرمجين توفير برنامج الخلط / الفصل الخاص بهم؛ من أجل تحسين الأداء 
كما يمكنهم أيضًّا نشر أداة الدمج التي تجمع بين ملفات مخرجات الخريطة المحلية؛ وذلك لتقليل عدد 
ملفات المخرجات التي يجب الوصول إليها عن بُعد عبر المجموعة عن طريق خطوة الخلط / الفصل. 
لماذا $MapReduce eau‏ 

cob fail $as Le MapReduce esà;‏ في معالجة وتحليل كميات كبيرة من البيانات متعددة 
المراحل. وتنطوي أمثلة التطبيق على الفهرسة والبحثء والتحليلات البيانية وتحليلات النصء 
وتعلم الآلةء وتحويل البيانات وهكذا. وغالبًا ما تكون هذه الأنواع من التطبيقات صعبة التنفيذ 
باستخدام .501 القياسية المستخدمة بواسطة 182155 العلائقية. 

إن طبيعة ead)! Jas alo 451,2 I MapReduce‏ بواسطة المبرمجين ذوي امهارة. كما 
أنه Li‏ له ميزة أخرى وهي أن المطورين ليسو مُلرّمِين بالاهتمام بتنفيذ الحوسبة المتوازية, 
حيث يتعامل النظام مع هذا الأمر بشفافية. وعلى الرغم من أن MapReduce‏ تم تصميمه من 
أجل المبرمجينء إلا أن غير المبرمجين يمكنهم أيمًا استغلال قيمة كل من تطبيقات معد0ع 1م212 
ومكتبات الوظائف. MapReduce OLK igg‏ سواء المدفوعة أو المجانية والتى توفر نطاقًا 
واسعًا من القدرات التحليلية. فعلى سبيل المثال» نجد أن isa s Apache Mahout áSca‏ 
تعلم آلي مجانية ل ”خوارزميات التجميع والتصنيف والترشيح التعاوني المستند إلى الدفعة“ التي 
-MapReduce glaub Usos ex)‏ 
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1 o? :Hadoop 


Saroe Hadoop. 

يعتسبر 118000 إطار عمل ados (5535 dL edis laa‏ كميات ضخمة من البيانات 
المتفرقة وغير المهيكلة. وقد تم إنشاء 113000 في البداية من قبل «Yahoo e Doug Cutting‏ 
وقد تم استخلاص فكرة تقنية 1512000 من عع60خ1م28/12: والذي هو عبارة عن دالة محددة 
بواسطة المستخدم ومطورة بواسطة جوجل في بدايات الألفية الثانية من أجل فهرسة الويب. وقد 
تم تصميمه للتعامل مع البيتابايتس والإكسابايتس الخاصة بالبيانات التي تم توزيعها عبر عقد 
متعددة في نفس الوقت. وتعمل مجموعات م118100 على أجهزة مواد غير مُكلقّة بحيث يمكن 
توسيع نطاق ال مشرعات دون اللجوء للبنك. وقد أصبح و٥٥54‏ الآن مشروعًا لتأسيس برمجيات 
أباتشي u> «Apache Software Foundation‏ يعمل المئات من الملساهمين باستمرار على 
تحسين التقنية الأساسية. وتتمثل الفكرة الأساسية في: قيام 112000 بتجزثئة البيانات الضخمة 
إلى أجزاء متعددة بحيث يمكن معالجة كل جزء وتحليله في نفس الوقتء بدلا من كثرة التخبط 

في مجموعة ضخمة من البيانات باستخدام جهاز واحد. 


Hadoop doss càs 


يقوم العميل بالوصول إلى البيانات غير المهيكلة وشبه المهيكلة من المصادر بما في ذلك ملفات 
السجلء وإشعارات وسائل التواصل الاجتماعيء ومخازن البيانات الداخلية» ثم يقوم بتقطيع البيانات 
إلى «أجزاء». وهذه الأجزاء يتم تنزيلها بعد ذلك في نظام ملفات يتألف من عُقد متعددة تعمل 
على أجهزة مادية. وأما مخزن الملفات الافتراضي في 112000 فهو نظام ملفات م118000 المُقّسمة 
.-HDFS si Hadoop Distributed File System‏ ومن الجدير بالذكر أن أنظمة الملفات مثل 
نظام 11215 هي أنظمة بارعة في تخزين كميات ضخمة من البيانات غير المهيكلة وشبه المهيكلة 
نظرًا لأنها لا تتطلب تنظيم البيانات في الصفوف والأعمدة العلائقية. حيث يتم نسخ كل «جزء» 
عدة مرات ثم يتم تنزيله في نظام الملفات بحيث إذا سقطت عُقدة. يكون هناك عُقدة أخرى لديها 
نسخة من البيانات امموجودة على العقدة التي سقطت. وتعمل عُقدة الاسم كمسهلء فهي ترجع إلى 
معلومات العميل مثل العٌُقد المتاحة. حيث تتواجد بيانات معينة في المجموعة» والعْقد التي سقطت. 

وبمجرد تنزيل البيانات في المجموعة: فإنها تكون جاهزة للتحليل من خلال إطار عمل .MapReduce‏ 
ويقوم العميل باختيار وظيفة ”و13“ - وعادةً ما تكون عبارة عن استعلام مكتوب بلغة Java‏ - 
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إلى إحدى عُقد المجموعة والمعروفة على أنها متعقب الوظائف. حيث يشير متعقب الوظائف إلى 
عُقدة الاسم لتحديد البيانات التي يحتاج إليها للوصول إلى إكمال هذه الوظيفة والمكان الموجود في 
المجموعة التي توجد فيها البيانات. وعند تحديد ذلك يقوم مُتَعَقب الوظائف بإرسال الاستعلام إلى 
العُقد ذات الصلة. وبدلًا من إعادة إدخال جميع البيانات إلى موقع مركزي من أجل المعالجة, فإن 
المعالجة تحدث في كل عُقدة في وقت واحد أو بشكل متواز. وهذه سمة أساسية خاصة . -Hadoop‏ 
وعندما تنتهي كل عقدة من معالجة مهمتها. فإنها تقوم بتخزين النتائج. ويقوم العميل 
بوظيفة ”التقليص“ من خلال متعقب الوظائف حيث يتم تجميع نتائج مرحلة الخريطة المخزنة 
داخليًا على العقد الفردية لتحديد «الإجابة» على الاستعلام الأصليء وعندئذ يتم تنزيلها على عقدة 
أخرى في المجموعة. وبوصول العميل إلى هذه النتائج والتي يمكن تنزيلها بعد ذلك في واحدة 
من العديد من البيئات التحليلية من أجل تحليلها. تكون وظيفة MapReduce‏ قد اکتملٽت. 
ومجرد أن تكتمل مرحلة 16010©6م812, فإن البيانات المعالجة تصبح جاهزة لإجراء المزيد 
من التحليلات بواسطة علماء البيانات وغيرهم من أصحاب المهارات المتقدمة لتحليل البيانات. 
حيث يستطيع علماء البيانات التحكم فيها وتحليلها مستخدمين أي عدد من الأدوات لأي عدد 
من المرات» ها في ذلك البحث عن الأفكار والأماط الخفيةء أو استخدامها كأساس لبناء تطبيقات 
تحليلية تواجه المستخدم. كما هكن أيصا تصميم البيانات ونقلها من مجموعات مهه1120 
إلى قواعد البيانات العلائقية» ومستودعات البيانات» وأنظمة تقنية المعلومات التقليدية الأخرى 
لإجراء مزيد من التحليل و / أو لدعم معالجة المعاملات. 
مكونات 113000 الفنية: 
تتكون ”حزمة“ 10٥p‏ من عدد من المكونات» والتي تشمل: 
- نظام ملفات م812000 المقسمة (1110585): وهي طبقة التخزين الافتراضية في أي مجموعة 
محددة من مجموعات م112000. 
- عقدة الاسم: وهي العقدة في مجموعة م112000 التي توفر معلومات العميل فيما يتعلق بمكان 
مستودعات البيانات الخاصة بالمجموعة وما يتعلق بحالة ما إذا فشلت إحدى العقد. 
- العٌقدة الثانوية: وهي نسخة احتياطية من اسم العُقدة» ففيها يتم إجراء نَسْحْ متماثل بشكل 
دوري ومستودعات البيانات من عقدة الأسماء في حالة فشلها. 
- مُتعقب الوظائف: وهو عبارة عن العقدة في مجموعة م518400 والتي تقوم بافتتاح وتنسيق 
MapReduce càl55‏ أو بمعالجة البيانات. 
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- العقد التابعة: وهي العمق الخاص بأي e953 Hadoop ås garo‏ العقد التابعة مستودعات 
البيانات واتخاذ التوجيه لمعالجتها من متعقب الوظائقف. 

وبالإضافة إلى هذه المكونات» فإن النظام البيئي م118000 يتكون من عدد من المكونات 
الفرعية التكميلية. فهناك مخازن البيانات 510501 مثل (ls HBases Cassandra‏ تُستخدم 
LA‏ لتخزين نتائج da) ILa op Java åd cole dlg -Hadoop  MapReduce cà 5l55‏ 
Pig‏ وهي لغة متاحة مجانًا ومصممة خصيضًا من أجل مه211200 CAT‏ لكتابة بعض 
وظائف ©116ل1:6م212 والوظائف الأخرى ل .Hadoop‏ كما أن هناك 51106 وهو عبارة عن 
مستودع بيانات مجاني يسمح بالنمذجة التحليلية داخل م512000 وقد تم تطويره في الأصل 
budg „Facebook åkulgs‏ يلي مكونات م1]2000 الفرعية الأكثر شيوعًا. 

$3 485 Hadoop هو عبارة عن إطار عمل لمستودعات البيانات القائم على‎ HIVE :Hive 
تطويره من قبل 1260001 وهو يسمح للمستخدمين بكتابة الاستعلامات بلغة مثل /5©[1 وتسمى‎ 
ليس‎ AlI SQL gash geou Loo MapReduce والتي يتم تحويلها بعد ذلك إلى‎ HiveQL 
لديهم خبرة ب نال186م342 باستخدام المستودع وجعله أسهل لدمجه مع ذكاء الأعمال وأدوات‎ 
وغير ذلك.‎ Revolutions Analyticsg Tableau «Microstrategy :J2a (3 4l التمثيل‎ 

©: وهي عبارة عن لغة استعلام قائمة على م118000 تم تطويرها بواسطة ومطهلا وهي 
سهلة التعلم نسبيًا كما أنها بارعة في امتدادات البيانات الطويلة جدًا والعميقة للغاية (حدود .50[1). 

15 إن HBASE‏ هي قاعدة بيانات غير علائقية تتيح عمليات بحث سريع في 
برنامج 118000 في وقت قليلء كما أنها تضيف إمكانيات المعاملات إلى م818000, مما يسمح 
للمستخدمين بإجراء التحديثات. وعمليات الحذف والإضافة. ويستخدم كل من eBay‏ 9 
Olly õuel Facebook‏ 1188518 بكثرة. 

M٤‏ [۴: وهو إطار عمل لتغذية م5]8000 بالبيانات. حيث يتم ملء كل مكان في البنية 
الأساسية لتقنية المعلومات تقنية المعلومات بالعملاء - داخل خوادم الويب» وخوادم التطبيقات» 
وأجهزة الجوال - على سبيل امثال: لجمع البيانات ودمجها في -Hadoop‏ 

071٤‏ وهو نظام معالجة سير العمل الذي يسمح للمستخدمين بتحديد سلسلة من 
الوظائف المكتوبة بلغات Pigg MapReduce Jia bossi‏ وع#119ومن ثم ربطها ببعضها 
البعض بذكاء. حيث يتيح 216 للمستخدمين تحديد أشياء. مثل: أنه لا يتم طلب استعلام 
خاص إلا بعد انتهاء الوظائف السابقة المحددة التي يعتمد عليها من أجل البيانات. 
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1: وهي مجموعة من الأدوات التي تعتمد Apache colesazu hi ca sl] ule‏ 
Hadoop‏ وإدارتهاء ومراقبته ا. ويقوم بقيادة تطويرها مهندسون من شركة هورتنورك 
tai $å Ambari de Jats glg dHortonworks)‏ بيانات هورتنورك الخاصة بها. 

«Hadoop colle Jala&a jaoj ga—us g OLLI Julus ellas 5s :AVRO‏ وهو 
بارع في تحليل البيانات والقيام بإزالة استدعاءات الإجراءات. 

“4101017 وهي مكتبة للتنقيب في البيانات» وهي تستخدم أكثر خوارزميات جمع البيانات انتشارًا 
للقيام بالتجميع, واختبار الانحدار, والنمذجة الإحصائية, وتنفيذ كل ذلك باستخدام نموذج „MapReduce‏ 

07 : وهو أداة اتصال لنقل البيانات من مخازن بيانات غير 112000 - مثل قواعد 
البيانات العلائقية ومستودعات البيانات - Hadoop dJ)‏ وهو يسمح للمستخدمين بتحديد موقع 
الهدف داخل م٥10‏ فضلا عن إرشاد و٥0٩5‏ لنقل البیانات من 1۵ء0 أو تراداتاء أو غيرها 
من قواعد البيانات العلائقية إلى الهدف. 

© وهى عبارة عن إدارة مركزية للبيانات الوصفية 7260201268 ومشاركة 
«Apache Hadoop —J cL sasJl‏ وهي تسمح برؤية موحدة لجميع البيانات في مجموعات 
H200‏ كما تتيح أدوات متنوعة تتضمن كلا من ع۴ و٠11۷‏ معالجة أي عناصر بيانات دون 
الحاجة إلى معرفة مادية بمكان مستودعات البيانات في ا مجموعات. 


م12000]: الإيجابيات والسلبيات: 

تتمثل الميزة الأساسية ل م118000 في أنه يسمح للمشاريع بمعالجة وتحليل كميات كبيرة 
من البيانات غير المهيكلة وشبه المهيكلة» والتي يتعذر الوصول إليها حتى الآنء بطريقة فعالة 
من حيث التكلفة والوقت. ونظرًا لأن مجموعات 1180008 يمكنها الوصول إلى البيتابايتس 
وحتى الإكسابايتس من البيانات» فإن المشاريع لم تعد بحاجة إلى الاعتماد على مجموعات عينات 
البيانات ولكن هكنها معالجة وتحليل كل البيانات ذات الصلة. وهكن لعلماء البيانات تطبيق 
تدخل الحلقات التكراريةء حيث إن تنقيح واختبار الاستعلامات باستمرار يؤدي إلى الكشف عن 
أفكار لم تكن معروفة مسبقًا. أيضًا من مميزات مه51800 أن البدء في استخدامه لا يحتاج إلى 
تكلفة عاليةء بالإضافة إلى أن المطورين يمكنهم sadla Blocs Apache Hadoop «luus (o3‏ 
بتجریب 14٥٥p‏ في أقل من يوم واحد. 

أما السلبيات الخاصة ب م18400 ومكوناته المتعددة فهي تتمثل في أنه لم يصل إلى مرحلة 
النضج كما أنه لازال في تطور حتى الآن. وكما هو الحال مع أي تقنية ناشئة وغير ناضجةء فإن 
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تنفيذ وإدارة مجموعات م11280100] بالإضافة إلى إجراء تحليلات متقدمة على كميات ضخمة من 
البيانات غير المهيكلة يتطلب خبرةً ومهارةً وتدريبًا عاليًا. ولسوء الحظء فإنه في الوقت الحالي 
هناك ندرة في مطوري م518000 وعلماء البيانات» مما يجعل الحفاظ على مجموعات Hadoop‏ 
المعقدة والاستفادة منها أمرًا ليس عمليًا. وبالإضافة إلى ذلكء Hadoop Obss guus ga d‏ 
العديدة في ا مجتمع» وتكوين المكونات الجديدة فإن هناك خطورة من التفرع وذلك كما هو 
الوضع مع أي تقنية / منهج مجاني غير ناضج. وف النهايةء Hadoop OLS‏ هو عبارة عن إطار 
موجه بالدفعات. بمعنى أنه لا يدعم معالجة وتحليل البيانات بشكل فوري. 

والمفاجأة السارة أن بعض أممع العقول في مجال تقنية المعلومات يساهمون في مشروع ۸4٩1۴‏ 
Hadoop‏ وفضلًا عن ذلك فإن هناك جيلًا جديدًا من مطوري م112000 ومن علماء البيانات ممن هم 
في مقتبل العمر. ونتيجة لذلك؟ تتقدم التقنية بسرعة لتصبح أكثر قوة وأسهل في التنفيذ والإدارة. وأما 
النظام البيئي للموردينء فإنه يتمثل في عمل كل من 564ناه10-م112000 والشركات حديثة الظهور 
Cloudera | s‏ و1101100115 والشركات الرائدة في تقنية المعلومات مثل أي IBM) el à‏ 
ومایکروسوفت Slejas do JS ezaii (Oracle) dSbsls «Teradata) L31l35 (Microsoft)‏ 
م112000 الجاهزة للشركات. والأدوات» والخدمات التجارية وذلك لجعل نشر التقنيات وإدارتها واقعًا 
عمليًا للمؤسسة التقليدية. وتعمل الشركات الناشئة الأخرى والتي هي في مقدمة التقنية, على تحسين 
مخزون البيانات N0801‏ (ليس Jall (SQL Läs‏ على تقديم أفكار قريبة فوريًا مع 112000 
وتقدم رؤية فنية )١-۷(‏ بعض الحقائق لتوضيح بعض اللمفاهيم الخاطئة -Hadoop Js‏ 

رؤية فنية ۲۰۷ 
توضيح بعض الحقائق الغامضة الخاصة بهادوب 

على الرغم من وجود هادوب والتقنيات المرتبطة به منذ أكثر من ١‏ سنوات» لازال معظم التاس 
يؤمنون ببعض ال مفاهيم الخاطئة حول هادوب والتقنيات المرتبطة به 3 ): -Hives MapReduce‏ 
وسوف تقدم القائمة التالية والتي تتكون من ٠١‏ حقائق توضيحًا لماهية هادوب وما يقوم به بالنسبة 
إلى ذكاء الأعمالء وكذلك حالات الأعمال والتقنية التي بإمكانها الاستفادة من ذكاء الأعمال ومستودعات 
البيانات والتحليلات القائمة على هادوب (2013 ,ص0ءیں۸). 

الحقيقة # :١‏ يتألف هادوب من برامج متعددة. دائمًا ما نتحدث عن هادوب كما لو أنه برنامج 
واحد مترابط» في حين أنه في الواقع عبارة عن عائلة من المنتجات والتقنيات المجانية والتي تشرف عليها 
مؤسسة برنامج عطاعهم4 (4855). وتتوفر بعض منتجات هادوب أيضّا من خلال توزيعات الموردين؛ 
وسيتم تقديم المزيد عن ذلك oY‏ 
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وتشمل Apache Hadoop åS‏ )$ ذكاء الأعمال حسب الأولوية)» كا مj .MapRedıceg «DFS‏ 
-Hues .Oozies .Sqoops «Flume |J] ááL2yb .Zookeepers .Pigs .Hbases «Hives‏ وما إلى ذلك. 
والتي يمكنك دمجها بطرق متنوعة. غير (Hives Hbase gs gaxo ws) MapReduces HDFS ol‏ 
قد يشكلان حزمة تقنية مفيدة لكل التطبيقات في ذكاء الأعمالء ومستودعات البيانات, والتحليلات. 

الحقيقة # !: يتوفر هادوب مجانًا ومفتوح المصدر لكنه متاح أيضًا من قبل الموردين. حيث 
à, Jos .apache.org Je ASF o» À»lzs 9355 olal Apache Hadoop glp à iS ol‏ 
للمستخدمين الذين يرغبون في الحصول على حزمة أكثر جاهزية Bus O duwga‏ قليلًا من الموردين 
الآن يقدمون تقسيمات هادوب التي تتضمن أدوات إدارية إضافية ودعمًا فنيًا. 

الحقيقة # ؟: يعد هادوب نظامًا بِيئيّه وليس منتجًا مستقلًا؛ إذ يشتمل نظام هادوب البيئي على 
قائمة متزايدة من برامج الموردين التي تتكامل مع أو تنشر تقنيات هادوبء ولن تحتاج لأكثر من دقيقة 
واحدة على محرك بحثك المفضل لتكتشف ذلك. 

الحقيقة # »: يعتبر 111135 نظام ملفاتء وليس نظام إدارة قاعدة بيانات (28345). ويُعد هادوب 
نظام ملفات مقسمة في اللقام الأولء ويفتقر إلى القدرات التي يمكننا ربطها بنظام 088 مثل الفهرسة, 
والوصول العشواف إلى البيانات والدعم ل.5©1. وهذا جيد, نظرًا لأن نظام 12۴5 يقوم بأشياء لا تستطيع 
قواعد البيانات العلائقية (82/155]) القيام بها. 

الحقيقة # 0: يتشابه 11197 مع .501 ولكنه ليس هو .501 القياسي. ويقصر العديد منا نفسه على 
:1 وذلك نظرًا لمعرفتنا الجيدة به بالإضافة إلى أن أدواتنا تتطلب ذلك. وبالنسبة ممن يعرفون لغة 
501 فإنهم يستطيعون تعلم الرمز اليدوي de s Hive‏ غير أن هذا لا يحل مشكلات التوافق مع 
الأدوات القائمة على SQL‏ 

الحقيقة # :٦‏ هناك ارتباط بين هادوب MapReduces‏ غير أن هذا الارتباط لا يقتضي أن يحتاج كل 
منهما للآخر. وقد قام المطورون على جوجل بتطوير عهنا164م2/9 قبل وجود 12۴5ء وهناك بعض 
Jas (I MapReduce JU.‏ مع مجموعة متنوعة من تقنيات التخزين» ها في ذلك 15۴5 وأنظمة 
الملفات الأخرى: وبعض .58×8s‏ 

الحقيقة ۷#: يوفر »٠٠۸م‏ التحكم في التحليلات» ولیس التحلیلات في حد ذاتها؛ حيث )9 MapReduce‏ 
هو محرك تنفيذ أغراض عامة والذي يتعامل مع تعقيدات الاتصال بالشبكةء والبرمجة ابمتوازيةء واحتمال الخطأ 
لأي نوع من التطبيقات التي يمكنك من خلالها تقديم رمزء وليس مجرد تحليلات. 

الحقيقة ۸#: يدور هادوب حول تنوع البيانات. وليس فقط حول حجم البيانات. فمن الناحية 
النظرية» يمكن لنظام 1110115 إدارة التخزين والوصول إلى أي نوع من البيانات Ul‏ مكنك وضع البيانات 
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في ملف ونسخ هذا الملف إلى los -HDFS‏ لأن هذا الأمر يبدو بسيطًا للغاية. كما أنه صحيح بصفة 
عامة. فهذا هو ما يجذب العديد من المستخدمين -Apache HDFS J‏ 

الحقيقة # 9: يعمل هادوب كمكمل لمستودعات البيانات؛ ونادرًا ما يكون بديلًا عنه. فقد صممت 
معظم ال منظمات مستودعات البيانات الخاص بها من أجل البيانات المهيكلة. والعلائقية. مما يجعل 
من الصعب حصر قيمة ذكاء الأعمال من البيانات غير المهيكلة وشبه المهيكلة. ويقوم هادوب بتكميل 
مستودعات البيانات من خلال التعامل مع أنواع البيانات متعددة الهياكل والتي لا تستطيع معظم 
مستودعات البيانات )0W6(‏ التعامل معها. 

الحقيقة # :٠١‏ يتيح هادوب أنواعًا عديدة من التحليلات. وليس فقط تحليلات الويب. فعلى الرغم 
من أن هادوب يقع عليه الكثير من الضغوط حول كيفية استخدام شركات الإنترنت له من أجل تحليل 
سجلات الويب وبيانات الويب الأخرىء إلا أنه توجد حالات أخرى يُستخدم فيها. فعلى سبيل المثال» 
تأمل البيانات الضخمة التي تأت من أجهزة الاستشعارء مثل: الروبوتات في التصنيع. أو d RFID‏ بيع 
التجزئة. أو مراقبة الشبكة في المرافق العامة. كما يمكن للتطبيقات التحليلية القديمة التي تحتاج إلى 
عينات كبيرة من البيانات - مثل تجزئة قاعدة العملاء. والكشف عن الغشء وتحليل المخاطر - أن تستفيد 
من البيانات الضخمة الإضافية التي يديرها هادوب. وبالمثلء فإنه يمكن لبيانات هادوب الإضافية أن 
توسع نطاق المشاهدات ٠١‏ درجة من أجل إنشاء عرض أكثر اكتمالًا ودقة. 


:NoSQL 


ظهر نمط جديد من قاعدة البيانات ذات الصلة يسمى .70501 (ليس فقط .50[1). وهو مثل 
هادوب» حيث يعالج كميات ضخمة من البيانات متعددة الهياكل. ومع ذلك فإنه في الوقت الذي يعد 
فيه هادوب بارعًا في دعم التحليلات التاريخية على نطاق واسع» فإن قواعد بيانات 710501 موجهة في 
معظمها (على الرغم من أن هناك بعض الاستثناءات المهمة). لتقديم بيانات منفصلة مخزنة بين كميات 
ضخمة من البيانات متعددة المراحل للمستخدم النهائ وجعل تطبيقات البيانات الضخمة آلية. وتفتقر 
هذه الإمكانية بشدة إلى تقنية قواعد البيانات العلائقية. وهذا يجعلها ببساطة لا تستطيع الحفاظ على 
مستويات أداء التطبيقات المطلوبة في مقياس البيانات الضخمة. 

وفي بعض الحالات» يعمل كل من .710501 وهادوب معًا في نفس الوقت. فعلى سبيل HBase JULI‏ 
المذكورة ÁT‏ هي قاعدة بيانات .1105001 منتشرة على غرار 81818016 000816 والتي غالبًا ما يتم نشرها 
-HDFS (4d uie‏ ونظام الملفات المقسمة م12400]. من أجل توفير عمليات بحث سريعة في هادوب 
في وقت قليل. ويتمثل الجانب السلبي لمعظم قواعد بيانات .20501 اليوم في أنها ACID ga dolas‏ 
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ehay (durability ukla ásolation Jl5s5Vls «consistency (3L a5Vls .atomicity oL yl) 
بالأداء وقابلية التوسع. كما يفتقر الكثير منها إلى وجود أدوات الإدارة والرصد الناضجة. ويتم التغلب‎ 
على القصور في هذين الجانبين السلبيين بواسطة مجموعات .70501 المجانية ومجموعة من الموردين‎ 
الذين يحاولون تسويق قواعد بيانات .710501 المختلفة. وتشتمل قواعد بيانات .20501 المتاحة‎ 
و‎ «CouchDB; .Riak |J! áL2Jb .Accumulos .MongoDBs .Cassandras .HBase حاليًا على‎ 
وغيرها. وتعرض الحالة العملية (۳-۷) استخدام قواعد بيانات .20501 في تره». كما‎ Dynamo 
توضح الحالة العملية (6-1) تطبيقًا للتواصل الاجتماعي حيث تم استخدام البنية الأماسية لهادوب‎ 
لتجميع مجموعة من الرسائل على تويتر لفهم أي أنواع المستخدمين الذين يشاركون في أي نوع من‎ 
الدعم لمرضى الرعاية الصحية الذين يبحثون عن معلومات حول الأمراض العقلية ا مزمنة.‎ 
۳-۷ حالة عملية‎ 
eBay حل البيانات الضخمة الخاص ب‎ 
هو أكبر سوق على الإنترنت في العام مما يتيح شراء وبيع أي شيء عمليًا.‎ 8y يعد‎ 
وقد تأسس هذا السوق في عام ٩۱۹۹ء حيث يربط ه۵8 بين أفراد مجتمع متنوع‎ 
eBay وتفاعلي من البائعين وا مش ترينء فضلًا عن الشركات الصغيرة. الجدير بالذكر أن‎ 
الجماعي له تأثير مذهل على التجارة الإلكترونية: فقد بلغت القيمة الإجمالية للسلع‎ 
84y ويقدم موقع‎ .۲۰٠۲ ملیار دولار في عام‎ ۷٥,٤ نحو‎ 84y المباعة على موقع‎ 
مليون عنصر للبيع.‎ 2٠١ مليون مستخدم نشط كما يقدم أكثر من‎ ١١1 خدمات لأكثر من‎ 
التحدي - دعم البيانات على نطاق واسع:‎ 
تُعد قدرة :8 على تحويل كميات ضخمة من البيانات التي تنتجها إلى أفكار‎ 
مفيدة مُكّن عملاءها من استخلاصها مباشرة من الصفحات ال متكررة. هي أحد مفاتيح‎ 
نجاحه الاستثنائية. ولاستيعاب النمو الضخم في بيانات :688 - فإن مراكز البيانات‎ 
التابعة له تقوم بأداء المليارات من القراءات والكتابات كل يوم - وبسبب زيادة الطلب‎ 
على معالجة البيانات بسرعات عاليةء فقد احتاج موقع 688 إلى حل ليس له اختناقات‎ 
مثيلة» بالإضافة إلى أنه قابل للتوسع. وقيود المعاملات المرتبطة بنهج قواعد البيانات‎ 
العلائقية الشائعة. أيضًا فقد كانت الشركة بحاجة إلى إجراء تحليل سريع على تشكيلة‎ 
واسعة من البيانات المهيكلة وغير المهيكلة التي تم التقاطها.‎ 
الحل - البيانات الفورية المتكاملة والتحليلات:‎ 
وتحديدًا‎ 8Q1 تقنيات‎ J| Jä eBay إن متطلبات البيانات الضخمة جعلت‎ 
أيضًا إلى تحليلات‎ ۲84¥ (oe! 485. .DataStax Enterprises Apache Cassandra 
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DataStax Enterprise gs åxea4l Apache Hadoop‏ إلى جانب Cassandra‏ التي 
تتميز بياناتها بالفئة عالية السرعة. وينطوي الحل على بنية تدريجية eBay Jags‏ 
قادرًا على نشر مجموعات من 5156م+282]6 10213512 المتعددة عبر عدة مراكز بيانات 
مختلفة باستخدام الأجهزة السلعية. والنتيجة النهائية هي أن موقع إ182» أصبح الآن 
قادرًا على معالجة كميات هائلة من البيانات بكفاءة عالية من حيث التكلفةء وبسرعات 
عالية جدّاء عند سرعات عالية للغاية» كما أنه أصبح قادرًا على تحقيق أكثر مما کان قادرا 
على تحقيقه مع نظام الملكية الأعلى تكلفة والذي كان يستخدمه. Olo eBay pgãsg‏ 
بإدارة جزء كبير من احتياجات مركز البيانات - أكثر من ١0١‏ تيرابايت من المخزون - في 

.DataStax Enterprises Apache Cassandra (ya JS «less: 

وتشمل العناصر الفنية الإضافية التي لعبت دورًا في قرار DataStax så eBay‏ 
Us: ue Enterprise‏ واسع كلا من قابلية التطوير الخطية للحلء والأمل الكبير في 
النجاح دون نقطة فشل واحدة, وأداء كتابة متميز. 

التعامل مع حالات الاستخدام المتنوعة: 

Enterprise elazz Lb eBay es à‏ ]102635 للعديد من حالات الاستخدام 
ال مختلفة. وتوضح الأمثلة التالية بعض الطرق التي تستطيع الشركة من خلالها تلبية 
احتياجات بياناتها الضخمة من خلال قدرات معالجة البيانات والتحليلات السريعة التي 
يوفرها الحل. وبطبيعة الحالء فإن (683 تجرب كميات ضخمة من سير الكتابة» والتي 
يتولى تنفيذها تطبيق 025538014 عند às Jas DataStax Enterprise à 2Jlxa‏ ]35 
كفاءة من أي حل يقدمه 8108815 أو .710501. وتشاهد 8327© حاليًا أكثر من 5 
مليارات من الكتابات يوميًا عبر مجموعات 035532058 المتعددة وأكثر من 0 مليارات 
من القراءات (معظمها غير متصل) يوميًا. 

وتنطوي حالة الاستخدام الواحدة التي de DataStax Enterprise Igas‏ قياس 
بيانات 2882© الاجتماعية التي يعرضها على صفحات المنتج الخاصة به. ويقوم تقسيم 
Enterprise (4 Cassandra‏ عتداكة]102 بتخزين جميع المعلومات اللازمة لتقديم 
بیانات ل ”يحب“ و“یفضل“ و“يريد” على صفحات منتجات gi aS eBay‏ نفس 
البيانات الخاصة بصفحة ”تفضيلاتك“ على موقع ,ه8 والتي تحتوي على جميع 
العناصر التي يحبها المستخدم أو يمتلكها أو Cassandra (ys ga dal à d c y‏ 
لصفحة ”تفضيلاتك“ كاملة. وتوفر yه8ء‏ هذه البيانات من خلال خاصية العدادات 
القابلة للتطوير المقدمة من 58لمهومهن. 
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وتعد موازنة الأحمال وتوافر التطبيق من الجوانب المهمة لحالة الاستخدام الخاصة 
التي نحن بصددها. وقد اعطت حلول ۵ذم eBay gà» lla Da)a8t× E۲‏ 
امرونة التي يحتاج إليها لتصميم نظام يكن أي طلب مستخدم من الوصول إلى أي مركز 
بيانات»ء مع وجود مركز بيانات يحتوي على مجموعة واحدة DataStax Enterprise jn‏ 
يشمل هذه المراكز. وتساعد هذه السمة في التصميم على موازنة تحميل المستخدم 
الوارد والقضاء على آي تهديد محتمل للتوقف عن العمل. وتستطيع 84y‏ إجراء تحليل 
عالي السرعة مع القدرة على الحفاظ على مركز بيانات منفصل يعمل على تشغيل عقد 
هادوب من نفس حلقة éll5s (V-V JS LI 5l) DataStax Enterprise‏ فضلًا عن 
خط بيانات الأعمال التي تعمل على تزويد صفحات الويب التي يزورها العملاء. 


— گر كر 




















Source: Data Stax. 


شكل -!: تطوير مركز متعدد البيانات التابع ل: تتدثا» 


وتشمل حالة الاستخدام الأخرى 2545 Hunch‏ (وهي شركة شقيقة لشركة ترهقاء) ”رسم 
الآذواق“ عناصر ومستخدمي Slog pai gila eBay‏ للعملاء بناءً على اهتمامات 
المستخدمين. وهثل موقع ,8ء على الويب رسمًا بيانيًا أساسيا بين جميع المستخدمين 
والعناصر المعروضة للبيع. حيث يتم التقاط جميع الأحداث (المزايدة: والشراء والبيع» 
والسرد) من خلال أنظمة وتخزينها كرسم بياني في 8 ويرى التطبيق أكثر من 
٠٠‏ مليون من الكتابات يوميًا ويحمل أكثر من ١‏ مليار قطعة من البيانات. 

وتستخدم a Jas DataStax Enterprise Lá eBay‏ حالات استخدام السلاسل 
الزمنية والقي تعتبر معالجة كميات ضخمة من البيانات بشكل فوري أمرًا له أولوية قبل 
كل شيء. وهذا يتضمن تسجيل وتتبع الإشعار المتنقل (في كل مرة يرسل فيها eBay‏ 
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إشعارًا إلى جوال أو أي جهاز فإنه يتم تسجيله في 458هه55ة0). بالإضافة إلى الكشف 
عن حالات الغشء وتسجيل طلب / استجابة 504 للتنزيلء وتحليلات وسجلات خادم 
RedLaser‏ )525( شركة أخرى شقيقة لشركة (eBay‏ 

ومن خلال الاطلاع على جميع حالات الاستخدام التي SS‏ يكون الاشتراط الشائع هو 
مدة التشغيل. وتدرك :83» تمامًا حاجتها إلى الحفاظ على أعمالها في مكانة متقدمة بالإضافة 
إلى الانفتاح من أجل أعمالهاء وتلعب 156,م:18016 :ه1215 دورًا أساسيًا في ذلك من خلال 
دعمها لمجموعات عالية التوافر. يقول 22161 27[ المهندس المخطط لمشروع Ql tle» :eBay‏ 
نكون على استعداد لتخطي الكوارث طوال الوقت. Cassandra gaws ol É> göl sèd ol‏ 
بمراكز بيانات متعددة نشطة حيث مكننا قراءة وكتابة بيانات في أي مكان وفي أي وقت». 

أسئلة للمناقشة: 

-١‏ ماذا يحتاج تإه8» إلى حل البيانات الضخمة؟ 

۲- ما هي التحديات» وما هو الحل اممقترح» وما هي النتائج التي تم التوصل إليها؟ 
Source: DataStax. Customer case studies. datastax.com/resources/casestudies/eBay‏ 

(accessed July 2016). 


حالة عملية ۷-> 
فهم جودة ودقة معلومات دعم الرعاية الصحية على تويتر 

يستطيع جميع مستخدمي شبكة الإنترنت اليوم المساهمة بالمعلومات فضلًا عن 
الاستفادة من المعلومات أيضًا. وتُستخدم هذه القوة بطرق مختلفة. ويستطيع 
المستخدمون على منصات الشبكات الاجتماعية مثل Twitter‏ نشر معلومات عن أوضاعهم 
الصحية بالإضافة إلى تلقي المساعدة لأفضل طريقة لعلاج هذه الحالات الصحية. وقد 
استفسر العديد من المستخدمين عن جودة المعلومات المنشورة على منصات الشبكات 
الاجتماعية. وعلى الرغم من أن القدرة على نشر المعلومات الصحية على تويتر تبدو 
مفيدة للكثير من المستخدمين الذين يستخدمونها بقصد الحصول على الدعم لمرضهم. إلا 
أنه دائنا ما يكون هناك شك حول صحة هذه المعلومات. oU‏ عندما يقوم بنشرها أفراد 
عاديون. وقد سأل العديد من المستخدمين: «كيف أتأكد وأثق في المعلومات التي يقدمها 
غير الخبراء حول كيفية التصرف في مسألة حيوية مثل حالتي الصحية؟» 

ما هي أنواع المستخدمين الذين يشاركون ويناقشون أي نوع معلومات؟ وهل 
يقوم المستخدمون الذين لديهم عدد كبير من المتابعين بمناقشة ومشاركة نفس نوع 
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ا معلومات التي يناقشها ويشاركها المستخدمون الذين لديهم عدد أقل من المتابعين؟ 
يرجع عدد متابعي المستخدم إلى مدى تأثير المستخدم؛ إذ يتم قياس خصائص ال معلومات 
من حيث الجودة وال موضوعية من التغريدة المنشورة. وقد انبرى فريق من علماء 
البيانات لاستكشاف العلاقة بين عدد متابعي ال مستخدم وخصائص المعلومات التي قام 
المستخدم -(Asamoah & Sharda, 2015) La io‏ 

الحل: 

تم التنقيب في البيانات من منصة تويتر باستخدام 451 التابع ل 118:6. وقد قام 
علماء البيانات بتكييف نموذج اكتشاف المعرفة وإدارة البيانات من أجل إدارة وتحليل 
هذه المجموعة الضخمة من البيانات. وقد تم تحسين النموذج لإدارة وتحليل البيانات 
الضخمة المستمدة من منصة الشبكة الاجتماعية وتضمن مراحل اكتساب معرفة المجالء 
وتطوير منصة البيانات الضخمة الملائمة, والحصول على البيانات وتخزيتهاء بالإضافة إلى 
تنظيف البيانات» والتحقق من صحتهاء وتحليلهاء كما تضمن النتائج والنشر. 

التقنية المستخدمة: 





تم استخراج التغريدات. وإدارتهاء وتحليلها باستخدام توزيع 010106178 الخاص 
ب le Apache Hadoop jb (59:255 .Apache Hadoop‏ العديد من المشاريع 
الفرعية التي تدعم أنواعًا مختلفة من أنشطة إدارة البيانات. مثل دعم المشروع الفرعي 
õel äU Apache Hive‏ والكتابة. وإدارة بيانات التغريدات الضخمة. وقد استخدمت 
أدوات لتحليل البيانات مثل نام والذي استخدم لتحليل الشبكات الاجتماعية و۸ 
للنمذجة التنبؤية. وقد قاموا بإجراء تحليلين متوازيين؛ تحليل الشبكة الاجتماعية لفهم 
الشبكة على المنصة واستخراج النص لفهم محتوى التغريدات التي نشرها ا مستخدمون. 

Tagg Ilo 

وكما ذكرنا سابقّاء فقد تم تجميع وتحليل تغريدات من كل المستخدمين المؤثرين وغير 
المؤثرين. وقد أظهرت النتائج أن جودة وموضوعية ا معلومات التي ينشرها ا مستخدمون 
المؤثرون كانت أعلى من تلك التي ينشرها ا مستخدمون غير المؤثرين. كما وجدوا أيضًا أن 
المستخدمين المؤثرين كانوا مسيطرين على تدفق المعلومات في الشبكة وأن المستخدمين 
الآخرين كانوا أكثر جذبًا متابعة رأيهم حول موضوع ما. وقد كان هناك اختلاف واضح 
بين نوع دعم المعلومات التي يقدمها ا مستخدمون المؤثرون مقايل غيرهمء حيث ناقش 
ا لمستخدمون المؤثرون معلومات أكثر موضوعية فيما يتعلق بإدارة امرض كالتشخيصء 
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والأدوية» والعلاجات الرسمية: في حين قدم المستخدمون غير المؤثرين معلومات أكثر 
حول الدعم العاطفي والطرق البديلة للتعامل مع is‏ هذه الأمراض. وبالتالي» فقد كان 
هناك اختلاف واضح بين المستخدمين المؤثرين وبين غيرهم من المستخدمين غير المؤثرين. 

يصور علماء البيانات من منظور غير الخبراء إمكانية زيادة توف ير الرعاية الصحية من 
خلال مساعدة المرضى على تحديد واستخدام الموارد القيّمة على الويب من أجل إدارة حالتهم 
المرضية. وساعد هذا العمل أيضًا على تحديد كيف يمكن لغير الخبراء اكتشاف موقع معلومات 
الرعاية الصحية التي قد لا تكون بالضرورة مفيدة لإدارة أوضاع المرضى الصحية وترشيحها. 

-١‏ ما هو الشاغل الرئيس لعلماء البيانات فيما يتعلق بالمعلومات الصحية التي يتم 
Twitter | Je Us åo‏ 

؟- كيف يضمن علماء البيانات أن تكون المعلومات المقدمة من غير الخبراء والتي 
تنشر على وسائل التواصل الاجتماعيء تحتوي بالفعل على معلومات صحية قيّمة؟ 

“- هل من المنطقي أن يشارك المستخدمون المؤثرون معلومات أكثر موضوعية بينما 
يكون تركيز المستخدمين غير المؤثرين على المعلومات الشخصية بشكل أكبر؟ وماذا؟ 
Sources: Asamoah, D., & Sharda, R. (2015). Adapting CRISP-DM process for social‏ 
network analytics: Application to healthcare. In AMCIS 2015 Proceedings. aisel.‏ 
aisnet.org/amcis 2015/bizAnalytics/GeneralPresentations/33/(accessed July 2016).‏ 


Sarasohn-Kahn, J. (2008). The wisdom of patients: Health care meets online social 
media. Oakland, CA: California HealthCare Foundation. 


أسئلة للمراجعة على القسم :٤-۷‏ 

-١‏ ما هى الخصائص المشتركة لتقنيات البيانات الضخمة الناشئة؟ 

MapReduce gala -Y‏ وماذا يعمل؟ وکیف یقوم بعمله؟ 

؟- ماهو هادوب؟ وكيف يعمل؟ 

-٤‏ ما هي المكونات الرئيسة لهادوب؟ وما هي الوظائف التي يؤديها؟ 

6- ما هو .205001؟ وكيف يتناسب مع صورة تحليلات البيانات الضخمة؟ 
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0-۷ البيانات الضخمة ومستودعات البيانات: 

ليس هناك شك في أن ظهور البيانات الضخمة قد أدى إلى تغيير مستودعات البيانات وسوف 
يستمر في تغييرها بشكل كبير. وقد كانت مستودعات بيانات المؤسسات (الفصلين Ys Y‏ حتى 
وقت قريب» هي محور جميع تقنيات دعم القرار. أما الآن فإن عليهم مشاركة أضواء الوافد 
الجديد والذي يتمثل في البيانات الضخمة. والسؤال الذي يطرح نفسه دائما هو هل سيتم 
استبدال مستودعات البيانات وتقنياتها الأساسية RDBMS‏ بالبيانات الضخمة وتقنياتها التمكينية 
مثل هادوب. وهل سنشهد تحديًا بين مستودع البيانات والبيانات الضخمة (أو من وجهة نظر 
التقنيةء بين هادوب و11081/15)؟ وفي هذا القسم سوف نوضح سبب عدم وجود أساس لهذه 
الأسئلةء وعلى الأقل سوف نبرر أن مثل هذا الاختيار ليس انعكاسًا للواقع في هذا الوقت. 

وقد شهد العقد الماضي أو نحو ذلك تقدمًا ملحوظًا في مجال أنظمة دعم القرار المعتمدة على 
الحاسب. والتي قد يُنسب إليها الفضل إلى حد كبير في مستودعات البيانات والتطورات التقنية في 
كل من البرامج والأجهزة للحصول على البيانات وتخزينها وتحليلها. وكلما زاد حجم البيانات» تزداد 
إمكانيات مستودعات البيانات. وقد اشتمل بعض التقدم الخاص بمستودعات البيانات على كل 
من المعالجة المتوازية على نطاق واسع (الانتقال من واحد أو عدد قليل إلى العديد من امعالجات 
المتوازية)» وشبكات منطقة التخزين (حلول التخزين القابلة للتطوير بسهولة) وتخزين الحالة 
الصلبةء ومعالجة قاعدة OLLI‏ والمعالجة في الذاكرة» والقواعد العمودية (التوجه بالعمود). وهذا 
كله مجرد غيض من فيض. وقد ساعدت هذه التطورات في الحفاظ على الحجم المتزايد للبيانات 
لتظل تحت السيطرة بينما تقوم بخدمة احتياجات التحليلات الخاصة بصانعي القرار بفاعلية. 
وما ساعد على تغير المشهد في السنوات الأخيرة هو تنوع وتعقيد البيانات» مما جعل مستودعات 
البيانات غير قادرة على مسايرة التقدم. ومن الجدير بالذكر أن التنوع والسرعة هي التي أجبرت 
عام تقنية المعلومات على تطوير نموذج جديد وليس حجم البيانات. حيث يُطلق على هذا النموذج 
الآن «البيانات الضخمة». والآن بعد أن أصبح لدينا هذان النموذجان - نموذج مستودعات البيانات 
ونموذج البيانات الضخمة المتنافسان ظاهريًا على نفس الوظيفة - لتحويل البيانات إلى معلومات 
قابلة للتطبيق - فأي نموذج منهما سوف يفرض نفسه؟ وهل هذا سؤال عادل لطرحه؟ أم أننا نفتقد 
الصورة الكبيرة؟ ولذلك فإننا نحاول في هذا القسم إلقاء بعض الضوء على هذا السؤال امثير للاهتمام. 

وكما هو الحال بالنسبة للعديد من الابتكارات التقنية السابقةء فقد أثيرت ضجة حول نموذج 
البيانات الضخمة وتقنياته التمكينية مثل هادوب وع1160116م212. فغير الممارسين كغيرهم من 
الممارسين قد طغت عليهم الآراء المتنوعة. ووفقًا ما ذكره كل من 850081125 وسقطهدك (2012)» 
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فإن الزاعمين بأن هادوب يحل محل قواعد البيانات العلائقية ويصبح هو مستودع البيانات 
الجديد لا يملكون البرهان على مزاعمهم. ومن السهل معرفة مصدر هذه الادعاءات لأنه يمكن 
تشغيل كل من هادوب وأنظمة مستودع البيانات بالتوازيء كما يمكن توسيع نطاقها إلى أحجام 
هائلة من البيانات» بدون مشاركة أي أسلوب بنائي. وأما على المستوى المفاهيميء فقد يعتقد ابمرء 
أنها قابلة للتبادل» في حين أنها ليست كذلكء وأن الاختلافات بين الاثنين تفوق أوجه التشابه. ولكن 
إذا لم تكن قابلة للتبادلء فكيف نقرر متى نستخدم هادوب ومتى نستخدم مستودع البيانات؟ 
حالات استخدام :Hadoop‏ 
كما سبق أن وضحنا في هذا الفصلء لقد كان ظه ور هادوب نتيجة للتطورات الجديدة في 
تقنيات الحاسب وشبكة التخزين؛ حيث يوفر هادوب طبقة من البرامج التي تمتد عبر الشبكة 
بأكملهاء وتحويلها إلى نظام واحد. وذلك باستخدام المكونات المادية للحاسب كأساس. Sus‏ على 
ذلك فإن هناك بعض الاختلافات الرئيسة التي تظهر بوضوح في هذا البناء منها: 
- يعتبر هادوب مستودعًا فضلا عن أنه يعمل على تنقية البيانات الأولية. 
- يعتبر هادوب أرشيقًا قويًا واقتصاديًا ونشطًا. 
ومن ثم» فإن هادوب يستحوذ على طرفي دورة حياة البيانات واسعة النطاق بدايةٌ عندما تظهر 
البيانات الأولية. وأخيرًا عندما تتراجع البيانات» ولكن لاتزال هناك حاجة إليها في بعض الأحيان. 
-١‏ هادوب كمستودع ومكان تنقية: نظرًا لأن أحجام البيانات الضخمة تصل من مصادر مثل 
أجهزة الاستشعارء والآلات» ووسائل التواصل الاجتماعي وتيارات النقرء فإن الخطوة الأولى 
تتمثل في التقاط جميع البيانات بطريقة دقيقة وتكلفة عملية. فعندما تكون أحجام البيانات 
ضخمة» فإن الإستراتيجية التقليدية للخادم المفرد لا تعمل لفترة طويلة. ومن ثم فإن تدفق 
البيانات في 12۴5 هنح مخططي المشروع المرونة التي هم في أمس الحاجة dad]‏ حيث 
إنهم لا يمكنهم فقط التقاط ٠٠١‏ تيرابايت في اليوم الواحد, بل يمكنهم أيضًا ضبط تهيئة 
هادوب للأعلى أو للأسفل لمواجهة تدفق أو انخفاض البيانات بما يتناسب مع مقدارهاء وهذا 
يتحقق بأقل تكلفة ممكنة لكل جيجابايت نظرًا لاقتصاديات المصادر المفتوحة والاستفادة من 
المكونات المادية للحاسب. ونظرًا لأن البيانات يتم تخزينها على وحدة التخزين المحلية بدلا 
من شبكات منطقة التخزينء فإن الوصول إلى البيانات في هادوب يكون أسرع بكثير في كثير 
من الأحيانء كما أنه لا يعيق الشبكة بحركة التيرابايتس من البيانات. وهجرد التقاط البيانات 
الخام» فإنه يتم استخدام هادوب لتنقيتها؛ حيث يمكن لهادوب أن يعمل بمثابة محرك موازي 
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«محرك ,1:11 على المنشطات». من خلال الاستفادة من تقنيات تحويل البيانات التجارية 
أو المكتوبة بخط اليد؛ إذ تتطلب العديد من هذه العمليات الخاصة بتحويل البيانات الأولية 
تفكيك البيانات ذات الصيغة الحرة المعقدة وتحويلها إلى تنسيقات منظمة. وهذا ينطبق 
بشكل خاص على تيارات النقر (أو سجلات الويب) وتنسيقات بيانات الاستشعار المعقدة. 
وبناءً على ذلك فإن المبرمج يحتاج إلى فصل الصالح عن الطالح (تنقية البيانات من كل ما 
ليس له أهمية) وتحديد ما هو قَيّم وسط هذا الصخب. 

۲- هادوب کأرشیف نش ط: في مقابلة أجريت عام ٠٠١‏ مع 4011 ادعى o al Jim Gray‏ 
الممكن معالجة الأقراص الصلبة كأشرطة. وعلى الرغم من أن أمر الاستغناء عن أرشفة الشريط 
المغناطيسي قد يستغرق عدة سنوات,. إلا أنه يتم إعادة توجيه بعض أجزاء عبء العمل 
الشريطية بالفعل إلى مجموعات هادوب. ويرجع هذا التحول لسببين أساسيين. أولهماء أنه 
على الرغم من أن أمر مستودعات البيانات على الشريط قد يبدو غير مكلفء إلا أن تكلفته 
الحقيقية تظهر مع صعوبة الاسترجاع. ولا يقتصر الأمر فقط على الساعات - إن لم تكن الأيام - 
التي تتطلبها البيانات المخزنة في وضع عدم الاتصال من أجل استرجاعهاء بل إن لفائف الشريط 
نفسها عرضة للتدهور مع مرور الوقتء الأمر الذي يجعل من عملية فقدان البيانات حقيقة 
واقعة ويجبر الشركات على استيعاب هذه التكاليف. ومما يزيد الأمور سوءًا هو تغير تنسيقات 
الأشرطة كل عامين. مما يتطلب من المنظمات إما إجراء عمليات ترحيل هائلة للبيانات إلى 
تنسيق الشريط الأحدث أو المخاطرة بعدم القدرة على استعادة البيانات من الأشرطة القدهة. 
وأما الأمر الثاني فقد تبين أن هناك قيمة لحفظ البيانات التاريخية على الإنترنت مع إمكانية 

الوصول إليها بسهولة. وكما هو الحال في مثال تيار النقرء فإن الاحتفاظ بالبيانات الأولية على 

قرص (بكرات) اللف لفترة أطول يسهل على الشركات إعادة النظر في البيانات عندما يتغير السياق 
والقيود الجديدة التي تحتاج إلى تطبيقها. إن عملية البحث عن آلاف الأقراص باستخدام هادوب 
تكون أسرع وأكثر سهولة من اللف عبر مئات الأشرطة المغناطيسية. وبالإضافة إلى ما سبق» فإنه 
مع استمرار تضاعف كثافات الأقراص كل ١6‏ شهرًاء يصبح من المجدي اقتصاديًا بالنسبة للمنظمات 
أن تحتفظ بالبيانات الخام أو المنقحة الخاصة بالعديد من الأعوام في 112155. ومن تم OL‏ شبكة 
تخزين هادوب تكون مفيدة في كل من المعالجة الأولية للبيانات الخام ومستودعات البيانات على 
المدى الطويل. فهو يعد بحق «أرشيقًا نش طًا» نظرًا لأنه لا يقوم بمستودعات البيانات ويحميها 
فحسبه بل GSF LÉ a)‏ المستخدمين من استخلاص القيمة بسرعة وسهولة وبشكل دائم. 
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حالات استخدام مستودعات البيانات: 
لقد أصبحت قائمة المميزات المتوفرة في مستودع البيانات مذهلة بدرجة كبيرة» بعد مرور ما 

يقرب من ٠١‏ عامًا من الاستثمار والتنقية, والنمو. فقد بُنيت على تقنية قواعد البيانات العلائقية 

باستخدام المخططات ودمج أدوات ذكاء الأعمال» وتتمثل الاختلافات الرئيسة في هذه البنية في: 

- أداء مستودع البيانات. 

- دمج البيانات التي توفر قيمة الأعمال. 

- أدوات ذكاء الأعمال التفاعلية للمستخدمين النهائيين. 

MySQL Ja dila أداء مستودع البيانات: إن الفهرسة الأساسيةء الموجودة في قواعد البيانات‎ -١ 
تُستخدم بغرض تحسين زمن استجابة الاستعلام أو فرض قيود‎ dud لهي سمة‎ Postgres أو‎ 
على البيانات؛ حيث تكن النماذج الأكثر تقدمًا مثل: طرق العرض الفعلية» وفهارس الانضمام‎ 
الإجماليء والفهارس المكعبة» وفهارس الانضمام المتفرق» من تحقيق مكاسب متعددة للأداء في‎ 
مستودعات البيانات. ومع ذلك فإن تحسين الأداء الأكثر أهمية حتى الآن المُحَسن القائم على‎ 
التكلفة؛ حيث يقوم امسن بفحص .501 الواردة ويقوم بدراسة خطط متعددة من أجل تنفيذ‎ 
501. كل طلب بحث في أسرع وقت ممكنء حيث يستطيع تحقيق ذلك من خلال مقارنة طلب‎ 
لتصميم قاعدة البيانات وإحصائيات بيانات شاملة والتي تساعد على تحديد أفضل مزيج من‎ 
خطوات التنفيذ. ويبدو المحَسن في جوهره وكأنما لديه مبرمج عبقري يقوم بفحص كل استعلام‎ 
وضبطه من أجل الحصول على أفضل أداء. وبسبب عدم وجود مُحَسن أو إحصائيات دهوغرافية‎ 
للبيانات؛ فإن الاستعلام الذي يمكن تشغيله في دقائق قد يستغرق عدة ساعات. حتى مع وجود‎ 
العديد من الفهارس. ولهذا السببء فإن موردي البيانات يقومون باستمرار بإضافة أنواع جديدة‎ 
من الفهارس» والتقسيم» والإحصائيات» بالإضافة إلى مميزات للمُحَسن. وعلى مدى الثلاثين عامًا‎ 
الماضية» كان كل إصدار للبرامج عبارة عن إصدار أداء. وكما س نلاحظ في نهاية القتسم الخاص‎ 
بهادوب» أنه (أي هادوب) يتفوق على مستودعات البيانات التقليدية في مجال أداء الاستعلام.‎ 

؟- دمج البيانات التي توفر قيمة الأعمال: وهي الالتزام بالإجابة على أسئلة الأعمال الأساسية في 
قلب أي مستودع. وتمثل البيانات المتكاملة, الأماس الوحيد المطلوب لتحقيق هذا الهدف. 
وأما سبب وجود مستودعات البيانات فيتمثل في سحب البيانات من مجالات تابعة متعددة 
بالإضافة إلى العديد من التطبيقات إلى مستودع واحد. ويتعين على مصممي نماذج البيانات 
ومهندسي استخراج» وتحويلء وتنزيل (8:11) مع البيانات الوصفية (ميتاداتا)ء وأدوات 
تنظيف البيانات» والعمل الدقيق أن يقوموا بترشيد تنسيقات البيانات» وأنظمة المصدر 
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والمعنى الدلالي للبيانات لجعلها مفهومة وموثوقة, وهذا يساعد على إنشاء مفردات مشتركة 
داخل الشركة بحيث يتم قياس وفهم المفاهيم الأماسية مثل: «العميل». و«نهاية الشهر» 
و«المرونة السعرية» بشكل موحد. الجدير بالذكر أن تجميع البيانات وتنظيفها ودمجها كما 
هي في مستودع البيانات لا يتم إلا في مركز تقنية المعلومات بأكمله» وليس في مكان آخر. 

۴- أدوات ذكاء الأعمال التفاعلية: تتيح أدوات ذكاء الأعمال من مژل: «Tableau «MicroStrategy‏ 
IBM Cognosg‏ وغيرها من الأدوات للمستخدمين التجاريين إمكانية الوصول ال مباشر إلى أفكار 
مستودع البيانات. فبداية يستطيع مستخدم الأعمال إنشاء تقارير بالإضافة إلى إمكانية إنشاء 
تحليلات معقدة بسرعة وسهولة باستخدام هذه الأدوات. ونتيجة لذلك فإن هناك اتجاهًا 
في العديد من مواقع مستودع البيانات نحو الخدمة الذاتية للمستخدم النهائي. كما يستطيع 
مستخدمو الأعمال بكل سهولة طلب تقارير أكثر مما توفره تقنية المعلومات. غير أن الأهم من 
الخدمة الذاتية. هو أن يكون المستخدمون على دراية تامة بالبيانات؛ إذ يمكنهم تشغيل تقرير 
واكتشاف ما فاتهم من مقياس أو فرز (الفلترة)ء بالإضافة إلى إجراء تعديل وتشغيل التقرير 
الخاص بهم مرة أخرىء كل ذلك في غضون دقائق. ولا شك أن هذه العملية تؤدي إلى حدوث 
تغييرات كبيرة في فهم المستخدمين للأنشطة التجارية وعملية صنع القرار. وأول هذه التغييرات» 
هو توقف المستخدمين عن طرح أسئلة تافهة ويبدأون بطرح أسئلة إستراتيجية أكثر تعقيدًا. 
وبشكل عام, فإنه كلما كان التقرير أكثر تعقيدًا وإستراتيجية» زادت الأرباح والإيرادات ووفورات 
التكاليف التي يجنيها ال مستخدم, وهذا من شأنه أن يحول بعض ال مستخدمين إلى «مستخدمين 
أقوياء» في الشركة؛ حيث يصبح هؤلاء الأفراد عباقرة في إثارة قيمة الأعمال من البيانات بالإضافة 
إلى توفير معلومات إستراتيجية قيمة للموظفين التنفيذيين. الجدير بالذكر أن كل مستودع 
بيانات في أي مكان يحتوي على: من ؟ إلى ٠١‏ من المستخدمين الأقوياء. 


المجالات الرمادية (أي واحد من الاثنين سوف يقوم بأداء المهمة): 

على الرغم من وجود العديد من المجالات التي تميز واحدًا عن الآخرء فإن هناك أيضًا مجالات 
رمادية لا يمكن فيها تمييز مستودع البيانات عن هادوب بوضوح. ففي هذه المجالات» يمكن 
للأداة إما أن تكون الحل المناسب وإما أن تقوم بأداء مماثل أو وظيفة غير جيدة على المهمة التي 
في متناول اليد. ويعتمد اختيار واحدٍ دون الآخر على متطلبات وتفضيلات المنظمة. وفي العديد 
من الحالات» يعمل كل من هادوب ومستودع البيانات معا في سلسلة إمداد ا معلومات» وكما هو 
الحال في كثير من الأحيان» تكون إحدى الأداتين هى الأفضل لتحمل عبء عمل معين (متقطة 
12 ,ةلاه AW‏ &) ويوضح الجدول (1-1) النظام الأمامي المفضل (واحد مقابل الآخرء أو 
احتمال المساواة) في إطار عدد من المتطلبات المرصودة الشائعة. 
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جدول :١-/‏ متى يجب استخدام أي Hadoop åar‏ مقابل DW‏ 
متى يجب م اي P‏ ر 
























































المتطلبات مستودع البيانات هادوب 

وقت استجابة منخفض وتقارير تفاعلية بالإضافة إلى Im OLAP‏ 

الالتزام يكون متطلبًا :501 (V 1 „ANSI Y+ -Y‏ 
معالجة أو استكشاف البيانات الخام غير المهيكلة. v‏ 
المحفوظات على شبكة الإنترنت بديلًا للشريط. (V‏ 
التنظيف عالي الجودة والبيانات المتسقة. v‏ 
من ٠٠١‏ إلى ٠٠٠١‏ من المستخدمين المتزامنين. m‏ 
اكتشاف علاقات غير معروفة في البيانات. هك 
منطق عملية معقدة متوازية. il‏ 
تحليل 021 المكثف. 

النظام والمستخدمون وحوكمة البيانات. iv‏ 
العديد من لغات البرمجة المرنة التي تعمل بالتوازي. V‏ 
استكشافات :522060 غير المقيدة, وغير الخاضعة للحكم. VI‏ 
تحليل البيانات المؤقتة. ]7[ 

الأمان الشامل والامتثال التنظيمي. [v]‏ 7 


























الجمع بين هادوب ومستودع البيانات: 
هناك العديد من السيناريوهات المحتملة والتي بموجبها يكون الجمع بين كل من هادوب 
وتقنيات مستودعات البيانات القائمة على 182/15 العلائقية في الاستخدام, أكثر منطقية. وفيما 
يلي بعض هذه السیناریوهات )2012 :(White,‏ 
-١‏ استخدام هادوب لتخزين وأرشفة البيانات متعددة الهياكل: وحينئذ يمكن استخدام موصل 
ل 18815 العلائقية من أجل التنقيب في البيانات المطلوبة من هادوب لتحليلها بواسطة 


.10 ذكاء الأعمال والتحليلات وعلم البيانات. منظور إداري 


مفاهيم وأدوات البيانات الضخمة 


5 العلائقية. فإذا كانت 178815 العلائقية تدعم وظائف ع6لع1م2/]2 فإن هذه 
الوظائف يمكن اس تخدامها للقيام بعملية الاستخراج. Aster- Jaro OB JUL Junu oleg‏ 
gig SQOL-MapReduce càil5s paii ag Hadoop‏ تنزيل سريع للبيانات ثنائية الاتجاه 
Juss .Aster Databases HDFS (ja J$ g‏ مكن تحليل البيانات التي تم تنزيلها في 
قاعدة بيانات -MapReduces SQL (ya JS ela&zab Aster‏ 
۲- استخدام هادوب لتنقيةء وتحويلء و / أو دمج البيانات متعددة الهياكل: ويمكن استخدام موصل مثل 
محول م112000-:45]6 لاستخراج النتائج من معالج هادوب ل 183415 العلائقية من أجل تحليلها. 
؟- استخدام هادوب لتحليل كميات ضخمة من البيانات متعددة الهياكل ونشر النتائج التحليلية: 
حيث يعمل هادوب في هذا التطبيق, بمثابة منصة للتحليلات غير أنه يمكن إرجاع النتائج مرة 
أخرى إلى بيئة مستودعات البيانات التقليدية» أو مخزن بيانات مشترك بمجموعة العمل أو 
واجهة مستخدم مشتركة. 
- استخدام نظام 1282315 العلائقي الذي MapReduce cL lS! js‏ كمنصة حوسبة 
استقصائية: حيث يستطيع علماء البيانات استخدام نظام 182/15 العلائقي (مثل: نظام 
قاعدة (Aster cibLo‏ لتحليل مجموعة من البيانات المهيكلة ومتعددة الهياكل (المحملة من 
هادوب) باستخدام مزيج يتكون من كل من معالج .501 ووظائف MapReduce‏ التحليلية. 
-٥‏ استخدام أداة استعلام ۴۴٠٣١۲-٠٣۵‏ للوصول إلى البيانات وتحليلها: وهناء يتم تخزين البيانات 
في كل من هادوب و0818 العلائقية. 
فهذه السيناريوهات تدعم البيثة التي يكون فيه ا كل من هادوب و088 العلائقية 
منفصلّين عن بعضهما البعض كما يتم استخدام برنامج الاتصال لتبادل البيانات بين النظامين 
(انظر الشكل ۸-۷). ومن ا مرجح أن تتجه الصناعة على مدى السنوات القليلة المقبلة نحو 
تقنيات هادوب المرتبطة بإحكام بالإضافة إلى تقنيات مستودع البيانات المستندة إلى نُظُّم إدارة 
قواعد البيانات العلائقية على مستوى البرامج والأجهزة على حد سواء. حيث يوفر هذا التكامل 
العديد من الفوائد. والتي تشمل عدم الحاجة إلى تثبيت بالإضافة إلى صيانة أنظمة متعددة 
وتقليل حركة البيانات» وتوفير مخزن بيانات وصفية ميتاداتا واحد من أجل تطوير التطبيقات» 
فضلًا عن توفير واجهة واحدة لكل من مستخدمي الأعمال والأدوات التحليلية. وقد قدمت 
المقالة الافتتاحية (القسم ۱-۷) مثالا على كيفية دمج البيانات التي هي من مستودع البيانات 
التقليدي ومجموعتّي البيانات المختلفتين وغير المهيكلتين والمخزنتين في هادوب من أجل إنشاء 
تطبيق تحليلي للحصول على إحصاءات حول تفاعلات العميل مع الشركة قبل إلغاء الحساب. 
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وبصفتك مديراء فإن اهتمامك ينصب على الأفكار التي يمكنك استخلاصها من البيانات» وليس على 
ما إذا كانت البيانات مخزنة في مستودع بيانات مهيكل أو مجموعات هادوب. 
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أنظمة تشغيلية تيارات البيانات الخام‎ 





Sources: Teradatacorp. 


شكل /!-6: التعايش بین 1400p‏ ومستودعات البیانات 


أسئلة للمراجعة على القسم ا-0: 

-١‏ ما هي التحديات التي تواجه مستودعات البيانات والبيانات الضخمة؟ وهل نشهد نهاية عصر 
مستودعات البيانات؟ lbg‏ نعم أو SY SU‏ 

-Y‏ ما هي حالات الاستخدام للبيانات الضخمة وهادوب؟ 

"- ما هي حالات الاستخدام ممستودع البيانات و1108215؟ 

-٤‏ في أي السيناريوهات يمكن الجمع بين هادوب و11281/15؟ 


I-V‏ موردو ومنصات البيانات الضخمة: 
يتطور المشهد الخاص موردي البيانات الضخمة باعتباره مجالا تقنيًا جديدًا نسبيًا. وقد قام عدد 
من الموردين بتطوير تقسيمات هادوب الخاصة بهم والتي يعتمد معظمها على توزيع عع صم 
المجاني ولكن بمستويات مختلفة من التخصيص. وهناك اثنان من قادة السوق في مجال التوزيع وهما: 
C as (hortonworks.com) Hortonworks s (cloudera.com) Cloudera‏ بدأت Cloudera‏ 
بواسطة خبراء البيانات الضخمة ا فيم Jeff Hammerbachers «552b» (22s Doug Cutting‏ 
عام البيانات السابق في موقع التواصل الاجتماعي 826600016. أما هورتنورك فقد اشتقت من "Yahoo‏ 
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حيث تقدم كلتا الشركتين عرض التدريب / الخدمات المدفوعة الأجر على مستوى المؤسسة كما تقدم 
برمجيات إدارة هادوب مسجلة الملكية, بالإضافة إلى التوزيع الذي تقدمه في الأساس. كما تقوم 
(mapr.com) MapR‏ - 23« منشأة أخرى في هذ! المجال - بتقديم تقسيم هادوب الخاص بها والذي 
يكمل 1172155 بنظام ملفات الشبكة الخاص بها (2155) من أجل تحسين الأداء. وقد تشاركت شركة 
åS, ga EMC Greenplum‏ 1م212 في إصدار تقسيم هادوب الخاص بهما في مايو .١١١‏ وهذه 
الأمثلة لا تمثل إلا عددًا قليلًا من الشركات (القديمة والحديثة) التي تزاحم في المشهد التنافسي الخاص 
بأدوات ومقدمي الخدمات لتقنيات هادوب. 

وفي عاط 810501 فإن هناك عددًا من الشركات المبتدئة تعمل على تسليم إصدارات معتمدة 
تجاريًا من الصفات المميزة المختلفة الخاصة ب.5]050[1. فعلى سبيل اللمثالء تقدم DataStax‏ 
نسخة تجارية من 025530018 تتضمن دعم المؤسسات والخدمات» فضلا عن التكامل مع هادوب 
والبحث عن المؤسسات المجانية عبر Solr‏ عمع1.06. ويقوم معظم موردو تكامل البيانات الخاصة. 
ا في ذلك Jas) Syncsort |JI à 3L2yb .Pervasive Softwares Informatica‏ جولات في 
سوق البيانات الضخمة مع روابط هادوب والأدوات المكملة التي تستهدف تسهيل نقل البيانات 
على المطورين حول وداخل مجموعات هادوب. 

كما تشهد طبقة التحليلات في مجموعة البيانات الضخمة أيصًا تطورات مهمة. فعلى سبيل 
امثال» توجد شركة ناشئة تُسمى 041426۲ وتق وم هذه الشركة بتطوير ما تقول عنه بأنه 
منصة ذكاء الأعمال «الكل في واحد» من أجل هادوب» بينما قام برنامج 1016800" المتخصص في 
تصوي ر البيانات بإضافة هادوب واتصال مستودع بيانات الجيل التالي بمجموعة منتجاته. وفي 
الوقت EMC Greenplum i Sè olè cwi‏ لديها كُورّس كتارمط0): وهو عبارة عن ملعب 
لعلماء البيانات حيث يمكنهم qua‏ وتجربة» وتبادل كميات كبيرة من البيانات من أجل التحليل. 
وهناك موردون آخرون يركزون على حالات استخدام تحليلية محددة: مثل :011010 إلى جانب 
مُحرك تحليلات تجربة عملائها. ويعمل عدد من موردي ذكاء الأعمال التقليديين» وأبرزهم 
MicroStrategy‏ على الدمج بين تحليل البيانات الضخمة وكفاءة التقارير في منتجاتهم. 

كما أن مساحات تطبيق البيانات الضخمة تنمو أيضَّاء حيث تقدم العديد من الشركات 
تطبيقات مبنية للاستفادة من مجموعات هادوب وإطار ع»نالع1مة]3. وتحتوي الأدوات 
المجانية مفتوحة ا مصدر مثل لغة برمجة 1 على العديد من الدوال المُنفذة للاستفادة من التنفيذ 
ا متوازي من خلال مجموعات. وعلى سبيل المثالء تقدم شركة 15635388 تطبيقات البيانات 
الضخمة كخدمة للعديد من الصناعات. 
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وفي الوقت نفسه. فقد شهد سوق مستودع بيانات الجيل التالي مؤخرًا تجربة دمج كبيرة. فهناك 
jl‏ بعة من الموردين Aster Datas .Verticas .Greenplums .Netezza e» JUxLl Va ($ 62lJI‏ 
والذين تم اندماجهم مع HP EMCs 18M‏ وتيراداتاء على التوالي. وقد تم اندماج ۴٥٥‏ 
مع 2»11. كما يلعب الموردون العمالقة ©0261 و1831 أيضًا في مساحة البيانات الضخمة. فقد 
ga Oracle gils‏ أدوات البيانات الضخمة باستخدام .Exadata‏ وExal0gic‏ وأجهزة البيانات 
الضخمةء حيث يقوم جهاز البيانات الضخمة بدمج توزيع م112000 00100625 مع قاعدة بيانات 
Oracle's NoSQL‏ وأدوات تكامل البيانات. ويعتمد ڊرnliج Apache gle IBM Big1nsights‏ 
Hadoop‏ غير أنه يشتمل على العديد من الوحدات الخاصة والتي تتضمن قاعدة البيانات 51616228 
InfoSphere Warehouse;‏ وأدوات ذكاء الأعمال 5ه وإمكانيات 5855 للتنقيب في البيانات. 
كما يُقدم أيضًا تيارات 6:6طم10/05 1831 وبرنامج مصمم لتحليل تيارات البيانات الضخمة. ومع 
نجاح العلامة التجارية Watson analytics‏ فإن شركة 1834 تقوم بطرح العديد من عروض التحليلات 
الخاصة بها بشكل عام وعروض البيانات الضخمة بشكل خاص تحت تصنيف 118]508. وقد نتج 
عن استحواذ تبراداتا على 45۲۲ء تقدیم منتج مثیر g”! Teradata Aster $ olasW‏ تنفذ عددًا من 
وظائف التحليلات الشائعة الاستخدام في بيئة البيانات الضخمة. وفيما يلي سنقدم موجرًا عن بيئات 
Aster 1BM's InfoSphere i, US‏ eradataا‏ بالإضافة إلى تقديم حالة عملية قصيرة لكل منهما. 
وقد اخترنا تقديم هذين البرنامجين هنا تحديدًا نظرًا لأن كلا منهما يُعد من البرامج الناجحة تجاريًاء 
كما تتوفر لهم مواد تعليمية كثيرة والتي تتضمن البرامج القابلة للتنزيل. 
:IBM's InfoSphere BigInsights iaw‏ 

مقدمة: يعد daz. IBM 45,2) gjUJl InfoSphere BigInsights‏ 468 على مشروع Apache‏ 
Hadoop‏ المجاني لتحليل البيانات اطهيكلة التقليدية الموجودة في قواع د البيانات القدهة إلى 
جانب البيانات شبه المهيكلة وغير المهيكلة مثل النصوص. والفيديوء والصوت, والصورء ووسائل 
التواصل الاجتماعي» وسجلات الويبء وتيارات النقر. حيث تقوم المنصة بدمج العديد من 
تطبيقات ءء٠4٠‏ ۸م12 من خوارزميات التحليلات لتشغيل تطبيقات متوازية على نطاق glo‏ 
وهو مصمم لتوفير تحليلات متقدمة عن تقنية هادوب التي تم تحسينها بشكل خاص من أجل 
متطلبات تحليل البيانات الضخمة. 

أسلوب البناء: يعرض الشكل (-4) المكونات المختلفة الخاصة ب عتعدام15105 /181 
Apache Hadoop e—45,; IBM 7 BigInsights , 35,5 .BigInsights‏ القياسيء وبالإضافة 
إلى ذلك فإنه يوفر أيضَا تقنيات فريدة ولغات برمجة إلى جانب التحليلات المدمجة ومُسرعات 
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التطبيقات (مثل: النصء والجغرافيا ا مكانيةء والسلسلة الزمنية» والتنقيب في البيانات» والتمويل» 
ووسائل التواصل الاجتماعيء وحدث الاتصالات» وبيانات الآلة) لتنفيذ العمليات المتخصصة 
بكفاءة من أجل تلبية متطلبات تحليل البيانات الضخمة. فعلى سبيل المثاله تم تصميم (/14©1 
)[S0N Query Language‏ من أجل تحسين معالجة وتحليل بيانات ترميز (JSON)‏ وعناصر 
JavaScript‏ شبه المهيكلة. وهذه الوظائف مفيدة بشكل خاص في تحليل تيارات بيانات تويتر. 
وتمثل 5اءعاكعذ8 أداة نمط جدول البيانات التي تدعم استكشاف وتصوير البيانات القابلة للتوسع 
على جدول .501 الضخم المستقر على 111055. وتقدم لغة الاستعلام AQL) Annotation 4isdlLl‏ 
18 :1617 ©) مكتبات مدمجة من أجل تحليلات النصوص المتقدمة عبر كميات هائلة 
من المستندات شبه وغير المهيكلة. أما +8181 فهو عبارة عن برنامج للتحليلات واسعة النطاق 
على هادوب والذي يكن من الوصول إلى البيانات المستقرة على 110۴8 ومعالجتهاء وتحليلهاء 
وتصورهاء حسب واجهة المستخدم ۸. وأخيرا وليس آخرّاء فإن InfoSphere BigInsights cilo»l‏ 
od Eclipse J‏ المطورين من تطوير برامج لتعمل على Vas dnfoSphere BigInsights‏ 
تتضمن هذه البرامج معالجات. ومولدات الكود. وبيئة اختبار لتبسيط جهود تطوير التطبيقات. 
ومع توفر كل هذه الأدوات في برنامج واحد مستمرء يمكن تطوير ونشر التطبيق بسرعة في كتالوج 
ع1 القائم على الويب» ومن ثم استخدام وحدة تحكم خاصة بالويب لنشر التطبيق على 
مجموعات هادوب والسماح للمستخدمين الذين لديهم الصلاحية أن يصلوا إليه. 
إصدار Biginsighits jh‏ 
الأدرات الإدارية والتنموية اتطبيفات التحليلات والإكتشافات 
rry air)‏ 
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كيف تبدأ: يمكن تنزيل تجارب وأطعذوم1ع81 من الرابط: 
http://www.ibm.com/analytics/us/en/technology/hadoop/hadoop-trials.html‏ 
كما أن إصدار البدء السريع من ءاطعاو«آع8 متاح للتنزيل مجانًا عبر 
http://www.ibm.com/developerworks/downloads/im/Biginsightsquick/‏ 
وهو يعالج مجموعة أحادية أو متعددة من المصدر المفتوح م512400. كما يتطلب نظامًا 
يحتوي على ذاكرة وصول عشوائي تبلغ سعتها G8‏ 16 على الأقل, بالإضافة إلى معالج رباعي النواة, 
و8 50 مساحة حرة. 
وأفضل مكان لبدء تعلم IBM 55,2 JV ia sa InfoSphere BigInsights aso ls‏ للمعلومات: 
http://www.ibm.com/support/knowledgecenter/SSPT3X 2.1.2/com.‏ 
ibm.swg.im.InfoSphere.Biginsights.tut.doc/doc/tut Introduction.html.‏ 
وتقدم الحالة العملية (0-1) مثالًا يوضح كيف هكننا دمج البيانات من مصادر متعددة 
لتحليل تقارير الانفلونزا. 
حالة عملية ٥-۷‏ 
استخدام وسائل التواصل الاجتماعي للتنبؤ الفوري بنشاط الانفلونرا 
تفرض الأمراض ال معدية عبثًا كبيا على نظام الصحة العامة ف الولايات المتحدة 
الأمريكية. وقد أدى ظهور فيروس نقص الناعة البشرية / الإيدز à HIV/AIDS‏ 
أواخر السبعينيات. وفيروس الانفلونزا 111711 في عام 7٠05‏ ووباء 113272 خلال 
موسم شتاء "١17‏ - 2701 وتفش فيروس إيبولا 186018 في عام ۲۰٠١‏ بالإضافة إلى 
فيروس زيكا 2112 الذي انتشر في عام 015" إلى إثبات قابلية الناس للإصابة بمثل 
هذه الأمراض المعدية. ومن الناحية الفعلية, فإنه يحدث تفقٌّي للانفلونزا كل عام 
بأشكال مختلفة وينتج عنها آثار متباينة. ويبلغ متوسط التأثير السنوي لتفشَّي فيروس 
الانفلونزا oa asl‏ في الولايات المتحدة 7٠١57٠‏ شخصًا فَقَد الحياة من أعمار مختلفة 
غير محصورة. و۳۱ مليون يوم في المستشفىء» و٤,٠٠‏ مليون زيارة للعيادات الخارجية. 
وإجمالي 41.١‏ مليار دولار كعبءٍ اقتصادي. ونتيجة لهذا الاتجاه امتزايدء فقد ظهرت 
على الساحة في السنوات الأخيرة أساليب جديدة لتحليل البيانات بالإضافة إلى ظهور 
تقنيات قادرة على اكتشاف مثل هذه الأمراض وتتبعها ورسم خرائطها وإدارتها. وقد 
أعطت أنظمة المراقبة الرقمية بوجه خاصء وعودًا بقدرتها على اكتشاف أنماط البحث 
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عن الصحة العامة وتحويل هذه الاكتشافات إلى إستراتيجيات قابلة للتطبيق. 

وقد بين هذا المشروع أنه يمكن استخدام وسائل التواصل الاجتماعي كطريقة فعالة 
للكشف المبكر عن تفشي الانفلونزا. فقد استخدمنا منصة البيانات الضخمة لاستخدام 
بيانات BL 23 Zl. Jal os Twitter‏ الانفلونزا في الولايات المتحدة. وقد تضمنت 
أساليبنا في تحليل البيانات الضخمة استخراج كل من الزمانء واللمكانء والنص. فقد 
قمنا في التحليل الزمني بفحص ما إذا کان هكن $a Twitter Oblo AS Jeil‏ 
الفوري بمدى تفشَّي الانفلونزا. كما قمنا في التحليل المكانيء بتخطيط تفشي الانفلونزا 
للخاصية الجغرافية المكانية من بيانات تويتر لتحديد النقاط التي تؤثر فيها الانفلونزا 
بشكل فعال. وقد تم إجراء تحليلات النص للتعرف على الأعراض والعلاجات الشائعة 
للانفلونزا والتي تم ذكرها في التغريدات. 

وقد تم استخدام منصة BM InfoSphere BigInsights‏ لتحلیل مجموعتین من 
بيانات نشاط الانفلونزا؛ حيث استخدمت بيانات تويتر لمراقبة تفشّي الانفلونزا في الولايات 
امتحدةء بالإضافة إلى استخدام مستودع بیانات ء1۴2 Cerner Heal‏ لتتبع اللقاءات 
السريرية في العام الحقيقي. وقد انتقل حجم ضخم من التغريدات المتعلقة بالانفلونزا 
Twitter Streaming API ela2z Lob 393 os‏ حتى تم استيعابه في مجموعات 
هادوب. وبمجرد تلقي البيانات gla‏ استخدمت JSON Query Language 8l»l‏ 
(14©010) لمعالجة وتحليل بيانات ترميز عناصر 37251154[ الشبه منظمة JSON)‏ 
وبعد ذلك تم استخدام 11197 لهيكلة البيانات النصية وفصل المعلومات من أجل تحليل 
الموقع المكاني والزماني والتصوير في 12. كما تم تنفيذ عملية التنقيب في البيانات بالكامل 
باستخدام وظائف 6ع1260م212. وقد استخدمنا الحزمة 818۸ لتقديم نصوص ۸ عبر 
البيانات امخزنة في 12۴5. حيث مكنتنا الحزمة 81 من الاستفادة من الحساب 
المتوازي لنظام 111055 كما مكنتنا من إجراء عمليات 160106م212. وقد استخدمت 
مكتبات 451 لخرائط جوجل كأداة رسم خرائط أساسية لتصوير مواقع التغريد. 

وقد أظهرت النتائج التي توصلنا إليها أن التكامل بين كل من وسائل التواصل 
الاجتماعي والسجلات الطبية يستطيع أن يكون مكملًا ذا قيمة لنظم المراقبة القائمة. كما 
أكدت نتائجنا أن الحركة المرتبطة بالانفلونزا على وسائل التواصل الاجتماعي ترتبط ارتباطًا 
وثيقًا بتفشَّي الانفلونزا الفعلية. وقد أظهر ذلك أيضَّا باحثون آخرون St Louis, Zorl;)‏ 
Broniatowski, Paul, & Dredze, 2013‏ ;2012(. 389 أجر ينا تحليل سلسلة زمنية 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري aov‏ 


الفصل السابع 


للحصول على الارتباط المتبادل المكاني والزماني بين الاتجاهين (41) ولاحظنا آن مواجهات 
الانفلونزا الإكلينيكية تأت خلف المشاركات عبر الإنترنت. وبالإضافة إلى ذلك. فقد كشف 
تحليل موقعنا عن عدة مواقع عامة نشأت من خلالها أغلب التغريدات. وهذه النتائج 
يمكنها ممساعدة ا مسؤولين عن الصحة والحكومات على تطوير نماذج تنبو أكثر دقة في 
الوقت المناسب أثناء حدوث التفشّيء وإبلاغ الأقراد حول المواقع التي يجب تجنبها خلال 
تلك الفترة الزمنية. 

-١‏ اذا تستطيع وسائل التواصل الاجتماعي أن تكون بمثابة مؤشر مبكر على تفشّي 
الانفلونزا؟ 

le -Y‏ هي المتغيرات الأخرى التي قد تساعد في التنبؤ بمثل هذه التفشيات؟ 

- لماذا تُعد هذه المشكلة مثالا جيدًا يمكن حله باستخدام تقنيات البيانات الضخمة 
المذكورة في هذا الفصل؟ 
Sources: Zadeh, A. H., Zolbanin, H. M., Sharda, R., & Delen, D. (2015). Social‏ 
media for nowcasting the flu activity: Spatial- temporal and text analysis. Business‏ 
Analytics Congress, Pre-ICIS Conference, Fort Worth, TX. Broniatowski, D. A.,‏ 
Paul, M. J., & Dredze, M. (2013). National and local influenza surveillance through‏ 
Twitter: An analysis of the 20122013- influenza epidemic. PloS One, 8(12), e83672.‏ 


Moran, P. A. (1950). Notes on continuous stochastic phenomena. Biometrika, 1723-. 


:Teradata Aster aio 
مقدمة: إن #عادة 16:20213' هي منصة بيانات ضخمة للتخزين الموزع ومعالجة مجموعات‎ 
البيانات الكبيرة متعددة الهياكل. وقد استخدمت هذه المنصة لتحسين التسويق» وكشف الاحتيالء‎ 
كما استُخدمت في التحليلات الرياضية» وتحليل الشبكات الاجتماعية» بالإضافة إلى تحليلات البيانات‎ 
وتحليلات الطاقةء وتحليلات الرعاية الصحيةء والعديد من التطبيقات الأخرى. وقد قامت‎ «à VI 
موازاة العديد من وظائف التحليلات التقليدية وال متقدمة كما أن لديها قدرات‎ "erat Aster 
لإجراء تحليل السلاسل الزمنية والتحليل الإحصافي, وتحليل الكتلة, والتنقيب في النصء بالإضافة‎ 
إلى التنقيب في قاعدة الترابط. وتحليل الشبكات الاجتماعيةء والتحليلات ال مرئيةء وتحليلات الموقعء‎ 
والتحليلات التنبؤية؛ حيث تقوم بإجراء كل ذلك بطريقة موزعة. وبالإضافة إلى حزم التحليلات‎ 
التقليديةء فإن إم†ءA 1620218 لديها أيضًا العديد من حزم التحليلات الجديدة والفريدة لتحليل‎ 

المسارء كما أنها متوافقة أيضًا مع لغات البرمجة الأغرى مثل ۸» Javag Python‏ 
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أسلوب البناء: لقد تم تكييف عاق Teradata‏ مع master-slave slo glai‏ الخاص ب 
-Apache Hadoop‏ 29 يتكون من عقدة ملكة وعقد عامل متعددة وهى تعادل كلا من عقد 
الاسم وعقد البیانات في هادوب» على التواي. ویقدم الشکل (۱۰-۷) اسلوب بناء ۴ی (1. 








Sources: Teradata Corp. 


Teradata Aster ةıiڊ‎ :1۰-۷ شكل‎ 

وتقوم عقدة الملكة في الطبقة العليا بإدارة النظام» والمخطط, ومعالجة الأخطاء وتوزيع الحساب 
على العاملين. فهي تقوم بتنسيق الاستعلامات وإرجاع نتائج الاستعلام. أما الطبقة الوسطى من 
البناء فهي تحتوي على العمالء حيث يقوم العمال بمستودعات البيانات باستخدام عامل التكرار 
الذي يعينه المسؤول. ومن نَم فإنهم يتحملون الأخطاء. ويتفاعل العمال مع بعضهم البعض لمعالجة 
الاستعلامات التي تطلبها الملكة. ويتكون المستوى الثالث من البناء من عقدة مسؤول التنزيل والتي 

تستقبل البيانات من أطراف ثالثة مثل نظم المعلومات. 
وتشتمل بنية ۸5٤٩۲‏ 17 على متجر ملف أستر Aster File Store‏ والذي همکنه استیعاب بيانات 
متعددة مثل سجلات الويب» وبيانات جهاز الاستشعارء وبيانات سجل الآلة. وهو متوافق مع 
5 بأنظمة الملفات التقليدية الأخرى. وبمكن أيضًا توصيل المجموعة بقواعد بيانات أخرى 
مثل 128 Teradata Warehouses «Oracle‏ بالإضافة إلى 1117 من خلال الروابط الأخرى اللتاحة. 
وبالنس بة لتحليل البيانات, فإن المستخدم بمكنه كتابة الامتعلامات التقليدية لكل من .501: و 
TD J Lb] SQL-MR 45s .SQL-Graph (SQL-GR)5 .SQL-MapReduce (SQL-MR)‏ 
Aster‏ والذي تمكن أداء 2م112 من وظائف التحليلات في قاعدة بيانات :6]ىى. وبالمثل فإن 
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501-01 يعتبر إطار عمل من أجل تمكين معالجة محرك الرسم البياني في قاعدة بيانات :©1ق4. ويتم 
تنفيذ عملية الاستعلامات المكتوبة في 5Q1‏ أو 501-51-٧‏ أو 061-.501 تلقائيًا بشكل متوازي 
عبر المجموعة. وللوصول إلى قواعد البيانات وكتابة الاستعلامات فإنه يمكن للمستخدمين إما استخدام 
3(ACT) Aster Command | ài»‏ استخدام تطبيق من جانب العميل يسمى -Teradata Studio‏ 
وتشتمل الحزمة الكاملة من :©4851 (11 على أداة تستند إلى متصفح الويب للتصوير المرئي 
تسمى 0067165م42. حيث ممكن استخدام #عأمء0ممى لإنشاء أنواع مختلفة من التصويرات 
المرئية مثل مخطط تإع21ة5. ومخطط 518728, ومخطط 20:0ك. وهيكل الشجرة. ومخطط 
المجموعة الهرميةء وسحابة الكلمة» والمخطط الشريطيء والمخطط الدائريء وغيرها من الرسوم 
البيانية الإحصائية التقليدية الأخرى. 
كيف تبدأ: يتوفر الإصدار السريع من 48]©2 1620414 للتنزيل مجانًا. حيث کن تنزیل TD Aster‏ 
5 من هذا الرابط de Os$co 99. .(https://aster-community.teradata.com)‏ جهازين 
افتراضيين: ملكة واحدة وعامل واحد. كما أنه يتطلب جهازًا لا يقل عن ٤‏ 68 من الرامات «ذاكرة 
الوصول العشوائية». ويمكن O4 LS Aster Express à OLLI go GB W Lja pariul‏ 
الوصول إلى دليل البدء من خلال بوابة شبكة جlمعة www.teradatauniversitynetwork.) blaly5‏ 
I Jo. oss (com‏ الوثائق والتعليمات والتمارين ومجموعات البيانات من أجل Teradata els5‏ 
dlè Aster‏ يجب على الطرء إنشاء حساب على موقع 11721 على الويب. 
وقد سبق أن رأينا أمثلة على استخدام 4516 16520248 في المقالة الافتتاحية في الفصل الأول 
à‏ تحليلات الرياضة وأيضًا à‏ بداية هذا الفصل. وتوفر الحالة العملية(7-١)‏ مثالًا آخر على 
-Teradata Aster elascul‏ 
حالة عملية ٠-۷‏ 
تحليل أنماط امرض من مستودع بيانات السجلات الطبية الإلكترونية 
لقد تم منح مركز الإبداع في الأنظمة الصحية في جامعة أوكلاهوما الحكومية, 
مستودعًا ضخمًا للبيانات من قبل شركة 00502105 068261). والتي هي عبارة عن 
مزود السجلات الطبية الإلكترونية الرئيسة (EMRS)‏ للمساعدة في تطوير التطبيقات 
التحليلية. حيث يشتمل مستودع البيانات على 836185 في زيارات أكثر من 0٠0‏ مليون 
من المرضى الفريدين من نوعهم عبر مستشفيات الولايات المتحدة (1990 - 7016). كما 
أنه يشمل أكثر من 65 مليون زيارة قاهرة وطارئة وإسعافية. فهي أكبر قاعدة بيانات 
علائقية وحيدة في هذه الصناعة والتي تشتمل على سجلات شاملة مع الصيدليات» 
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والمختبرات» والأحداث السريرية: والقبول وبيانات الفوترة. كما تشتمل قاعدة البيانات 
على أكثر من 5,! مليار نتيجة معملية وأكثر من ١90‏ مليون طلب با يقرب من 50٠١‏ 
علاج بالاسم والعلامة التجارية. حيث تعد هذه القاعدة واحدة من أكبر مجموعات 
البيانات من نوعها غير محددة الهوية على أرض الواقع والمتوافقة مع 111244. 

ويمكن استخدام 814125 لتطوير تطبيقات تحليلية متعددة. وأحد هذه التطبيقات 
هو فهم العلاقات بين الأمراض على أساس المعلومات حول الأمراض المتزامنة (التي تأي 
في وقت واحد) المتقدمة في المرضى. فعندما يصاب مريض واحد بعدة أمراضء فإن 
هذه الحالة تسمى اعتلال مشترك. ومن الممكن أن تكون الأمراض المصاحبة مختلفة 
عبر المجموعات السكانية. وفي هذه الحالة العملية. قامت مجموعة بحثية في جامعة 
أوكلاهوما الحكومية بعمل مقارنة بين الأمراض المصاحبة في المرضى من المناطق الحضرية 
والأمراض المصاحبة في المرضى من المناطق الريفية. 

وللمقارنة بين الأمراض المصاحبة» فقد تم تطبيق نهج تحليل الشبكة. وتتألف 
الشبكة من مجموعة محددة من العناصر تسمى العقد» وترتبط هذه العقد ببعضها 
البعض من خلال الحواف؛ حيث تمثل الحافة علاقة محددة بين العقد. ومن أكثر الأمثلة 
شيوعًا على الشبكة, مثال شبكة صداقة يتواصل فيها الأفراد مع بعضهم البعض في All‏ 
ما إذا كانوا أصدقاء. وعلى نحو مماثل: فهناك شبكات أخرى مشتركة مثل شبكات 
الحاسب» وشبكات صفحات الويب بالإضافة إلى شبكات الطرقء وشبكات المطارات. 
ولمقارنة الأمراض المصاحبة» فقد تم تطوير الشبكات الخاصة بالأمراض في المرضى من 
المستشفيات الريفية والحضرية. وقد استُخدمت المعلومات المتعلقة بالأمراض والتي 
طورها كل مريض خلال زيارات المستشفى لإنشاء شبكة للمرض. وقد بلغ إجمالي 
عدد زائري المستشفيات في المستشفيات الحضرية 51 مليون» في حين بلغ إجمالي عدد 
الزائرين في المستشفيات الريفية ١‏ مليون شخص. ولإدارة مثل هذه المجموعة الضخمة 
من البيانات. تم استخدام منصة البيانات الضخمة +©]45 16:202148. كما استُخدمت 
-SQL-MRs SQL bi‏ وخ61-:501 والمدعومة بواسطة #عاقق. أيضًا فقد استخدم 
AppCenter‏ معامف ونامء06 لتصوير الشبكات مرثيًاء 

ويعرض الشكل )١١-1(‏ شبكات الإصابة المرضية المشتركة الريفية والحضرية. حيث 
تمثل العُقد في هذه الشبكات. الأمراض المختلفة المصنفة بحسب التصنيف الدولي 
للأمراضء المراجعة التاسعة:. التعديل السريري (02/1 102-9). مجمعة على dicia‏ 
ثلاثة أرقام» حيث يتم الربط بين اثنين من الأمراض في حالة ما إذا كانا مرتبطين بشكل 
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كبير أو بشكل مرضي (0.01 > «). وكلما زاد حجم العقدة. دل ذلك على زيادة الإصابة 
بالمرض. الجدير بالذكر أن كثافة شبكات الإصابة المرضية الحضرية أكثر من كثافة 
الشبكة الريفية؛ حيث يبلغ عدد العقد والحواف في الشبكة الحضرية VY, YA 5 V,- EY‏ 
على التواليء في حين أن عدد العقد والحواف في الشبكة الريفية يبلخ Y,- V5 A&Y‏ 
على التواليء مما يدل على أن تشخيص المرضى في ا مستشفيات الريفية غاليًا ما يشير 
إلى وجود عدد أقل من الأمراض المتزامنة. وتعرض التصويرات فرقًا واضحًا بين مط 
الأمراض المتقدمة في المناطق الحضرية والريفية» مما يستدعي العديد من الأمسئلة 
المتعلقة بالسياسات الطبية والاجتماعية والتي تتطلب المزيد من البحث والتحليل. 
وعلى الجانب الآخرء فقد قمنا بتضمين هذا التحليل لزيادة الوعي أيضًا بقضية أخرى. 
وقد لاحظنا مبكرًا أن مجموعة البيانات المستخدمة لهذا التحليل شملت حوالي 75 
مليون لقاء مع المرضى في المناطق الحضرية و١‏ مليون لقاء فقط مع ال مرضى في المناطق 
الريفية. وعلى الأرجح فإن هذا الاختلاف الكبير يرجع لعدم قدرة معظم ال مستشفيات 
الريفية على تحمل تكاليف نظام السجلات الطبية الإلكترونية الكبرى مثل «Cerner‏ 
وبالتالي فإن البيانات تميل نحو المستشفيات الحضرية. غير أن أي أفكار نتجت عن هذه 
العينة سوف يتم التشكيك فيها. وكما ذكرنا في الفصل الرابع» فإنه رها تم سحب عينة 
متناسبة من المناطق الحضرية وتمت مقارنتها بسجلات المرضى الريفيين. 
MEI ES‏ 

ص امراض الغدد الصماء والتغذية 

والتمثيل الغذائي واضرابات المناعة 
أمراض الدم واعضاء تشكيل الدم 


الإضطرابات العقلية 
أمراض الجهاز العصبي 





أمراض الجهاز البولي التناسلي 


ت الاسباب الخارجية للإصلية 
والتصنيف الإضافي 




















شكل :1١-۷‏ شبكات الأمراض المشتركة بين الحضر والريف 
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وستتحمل نظم قواعد البيانات التقليدية جهدًا في تجهيزها بكفاءة للبيانات 
الضخمة. وقد I OLLI Jls Teradata Aster pë‏ تحتوي على معلومات 
عن ۸٤‏ ملیون زیارة و۲۰۰ مليون سجل سريع وسهل إلى حد ما. وغالبًا ما يتم 
اقتراح تحليل الشبكة على اعتبار أنه طريقة واحدة لتحليل مجموعات البيانات 
الضخمة؛ فهو يساعد على فهم البيانات في صورة واحدة. في هذه الحالة العملية 
تبين شبكة الإصابة المرضية المشتركة العلاقة بين الأمراض في مكان واحد. 
أسئلة للمناقشة: 
-١‏ لماذا يمكن أن تكون الإصابة المشتركة للأمراض مختلفة بين المستشفيات في 
الريف وفي الحضر؟ 
-Y‏ ما هي مسألة الفرق الكبير بين مواجهات ال رضى في كل من المناطق الريفية 
والحضرية؟ 
؟- ما هي المكونات الرئيسة للشبكة؟ 
€- أين أيضًا يمكنك تطبيق نهج الشبكة؟ 
Source: Kalgotra, P, & Sharda, R. (2016). Rural versus urban comorbidity networks.‏ 
Working Paper, Center for Health Systems and Innovation, Oklahoma State University.‏ 
كما يزداد الدور الذي تلعبه السحابة في سوق البيانات الضخمة. ويقوم كل Googles Amazon (y‏ 
بدعم عمليات نشر هادوب في عروض السحابة العامة. Googles Amazon Elastic MapReduce ls‏ 
Gail «Jl! Je Compute Engine‏ يقومان بتمكين الممستخدمين من توسيع النطاق وتقليل حجم 
المجموعات بسهولة حسب الحاجة. وتقوم مايكروسوفت (381120501) بدعم توزيع هادوب الخاص 
بهورتنورك في سحابة 42156. وفي الفصل التالي سوف نناقش العروض القائمة على السحابة. 
كما ينتهج أيضًا موردون آخرون نهج البيانات الضخمة من زاوية التحليلات المرئية. وكما يشير 
Magic Quadrant‏ أحدث Ila olè Gartner Shlao!‏ 156 كبيرًا في ذكاء الأعمال والتحليلات 
في الاستكشافات والتحليلات المرئية. وتقوم الثركات الكبيرة مثل SAS‏ و8۸۶ و18۷1 بجانب 
شركات صغيرة غير أنها OlikViews .TIBCO Tableau |J Za 8,àz iue‏ بتقديم حالة قوية 
لتحليلات الأداء العالي الموجودة في منصات تصوير المعلومات. وتقدم رؤية فنية (7-) عددًا 
قليلًا من العوامل المساعدة الرئيسة لتحقيق النجاح مع البيانات الضخمة والتحليلات المرئية. 
وربما يكون 545 هو الدافع لها بقوة أكثر من أي شيء آخر مع منصته التي ظهرت مؤخرًا وهي 
5 للتحليلات المرئية. وقد سبق تقدهه في الفصل الثاني. وباستخدام العديد من التحسينات 
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الحسابية يستطيع برنامج التحليلات المرئية 545 تحويل عشرات الملايين من سجلات البيانات إلى 
رسومات بيانية معلوماتية خلال بضع ثوان فقط باس تخدام المعالجة المتوازية الواسعة (3155) 
والحوسبة داخل الذاكرة. 


رؤية فنية ۲-۷ 
كيف تنجح مع البيانات الضخمة 
من البيت الأبيض وحتى منزلك يصعب العثور على منظمة أو شخص لديه اليوم بيانات 
أقل من عام مضىء حيث تتزايد خيارات قاعدة البيانات» كما يتطور ذكاء الأعمال نحو عهد 
جديد من التحليلات على مستوى المنظمة» بالإضافة إلى أن كل شيء يتحرك ولا يبقى واققًا 
في مكانه. فالمنظمات التي استطاعت تكييف هيكل البيانات الخاص بها وعملياتها بنجاح 
من أجل معالجة الخصائص الثلاثة للبيانات الضخمة - الحجم» والتنوع والسرعة - تعمل 

على تحسين الكفاءة التشغيلية» وتزايد الإيراداتء بالإضافة إلى تمكين نماذج أعمال جديدة. 

والحقيقة أن معدل التغيير سوف يتحقق فقط مع كل المنظمات التي تهتم بوضعها الذي 

يتعلق بالابتكار في كل ما يخص البيانات. إذَا ما الذي يجب على الشركات فعله حتى 

تحقق النجاح مع البيانات الضخمة؟ وفيما يلي بعض من التوصيات الصناعية: 

-١‏ التبسيط: إنه لمن الصعب أن تتم متابعة جميع موردي قواعد البيانات الجدد. 
وجميع المشاريع المجانيةء وجميع مقدمي خدمات البيانات الضخمة:. بالإضافة إلى 
أن كل هذه الأشياء سوف تزداد ازدحامًا وتعقيدًا في الأعوام المقبلة. ومن ثمء فهناك 
حاجة ماسة للتبسيط. فمن الضروري اتباع نهج إستراتيجي من خلال توسيع نطاق 
أنظمة معالجة المعاملات العلائقية والاتصال عبر الإنترنت الخاصة بك إلى واحد أو 
أكثر من البرامج الجديدة المُستضّافة داخل المؤسسة: أو خيارات قاعدة البيانات 
القانمة على الخدمة والتي تعكس احتياجات صناعتك ومنظمتك على أكمل وجه. 
ومن ثم اختيار منصة ذكاء الأعمال الذي يدعم الاتصالات المباشرة للعديد من قواعد 
البيانات وتنسيقات الملفات في الوقت المناسب. ومن الجدير بالذكر أن اختيار 
أفضل مزيج من بدائل الحلول لكل مشروع (ما بين الاتصال المباشر بقواعد البيانات 
السريعة وتلقي مستخرجات البيانات في داخل محرك التحليلات في الذاكرة لتعويض 
أداء قواعد البيانات البطيئة أو المثقلة بالأعباء) هو أمر بالغ الأهمية لنجاح أي 
مشاريع بيانات ضخمة. فعلى سبيل المثال: تتألف بنية تحليلات البيانات الضخمة 
من تيراداتا (وهي إحدى أشهر شركات مستودعات البيانات). وهادوب (وهو الحل 
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الأكثر نجاحًا لتحدي البيانات الضخمة). بالإضافة إلى 18616211 (وهو أحد موردي 
حلول التحليلات البصرية غزيرة الإنتاج). ويمكن للوظفي 682 تصوير الأفكار من 
أكثر من OF‏ بيتابايتس من البيانات. ويستخدم 'إ133ء حل التحليلات المرئية بواسطة 
لتحليل مدى ملاءمة البحث وجودة موقع إ82», الذي يقوم بمراقبة أحدث 
ملاحظات العملاء وقياس ميولهم» بالإضافة إلى تحقيق التقارير التشغيلية لأنظمة 
مستودعات البيانات» وقد ساعد كل ذلك على نجاح الثقافة التحليلية داخل 7إةآع. 

-Y‏ التعايش: إن استخدام نقاط القوة لكل منصة قاعدة بيانات» وتمكينها من التعايش 
في بنية بيانات مؤسستك لهو أمر ضروري. وهناك العديد من الكتابات التي تحدثت 
عن ضرورة الحفاظ على التعايش بين مستودعات البيانات التقليدية وقدرات 
المنصات الجديدة وتعهده بالرعاية. 

- التصوير: بالنسبة للشركات الرائدة في g Forrester Sà zo caos] clou‏ 
Gartner‏ فإن امؤسسات تتحرى أن يكون لديها منصات متقدمة لتصوير البيانات 
من أجل أن تكون أدوات أساسية مُكّنهم من مراقبة الأعمالء والعثور على DLII‏ 
واتخاذ إجراءات لتجنب التهديدات واقتناص الفرص. وتساعد التحليلات البصرية 
المنظمات في الكشف عن الاتجاهاتء والعلاقات» والعيوب عن طريق التحول المرثي 
من خلال كميات كبيرة جدًا من البيانات. ولتجربة التحليل المرئي خصائص معينة؛ 
فهي تتيح لك القيام بشيئين في أي doas iod‏ 
- تغيير البيانات التي تبحث عنها بشكل فوري. وتكمن أهمية هذا الأمر في كون 

الأسئلة المختلفة تتطلب بيانات مختلفة. 
- تغيير الطريقة التي تنظر بها إلى البيانات بشكل فوري. ويُعد ذلك مهما لأن كل 
عرض قد يجيب عن أسئلة مختلفة. 

وهذ المزيج يُحدث التجربة الاستطلاعية المطلوبة لأي شخص اللإجابة على الأسئلة 
بسرعة. وهذه التجربة في جوهرها تؤدي إلى أن يصبح التصوير البصري امتدادًا 
طبيعيًا لعملية التفكير التجريبي. 

4- التمكين: تسير البيانات الضخمة جنيًا إلى جنب مع خدمة ذكاء الأعمال الذاتية, 
ووفقًا لمجموعة مه0,ء0ه التي دُشرت مؤخرًاء فإن «قيمة التحليلات والبيانات 
الضخمة تزداد إلى أقصى حد». ومن الجدير بالذكر أن المنظمات التي لديها بيانات 
ضخمة تمتلك فرصة تفوق نسبة *7١‏ في إحتمالية أن يكون لديها مشاريع /81 
5 أكثر من المنظمات الأخرى والتي يتم توجيهها من قبل مجتمع الأعمالء وليس 
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من قبل مجموعة تقنية ا لمعلومات. وعبر مجموعة من الاستخدامات من معالجة 
مشاكل الأعمال الجديدة.ء وتطوير منتجات وخدمات جديدة بالكاملء والعثور على 
الذكاء القابل للتطبيق في أقل من ساعة. ومزج البيانات من مصادر متباينة تجعل 
البيانات الضخمة تطلق العنان با هو ممكن من خلال تطبيق التحليلات. 
- التكامل: يُعد تكامل ومزج البيانات من مصادر مختلفة جزءً! أساسيًا من تحليلات 
البيانات الضخمة لمنظمتك. فالمنظمات التي يمكنها مزج مصادر بيانات أولية, 
علائقية مختلفة. وشبه مهيكلة؛ في الوقت المناسبء وبدون تكاليف دمج أولية 
باهظة الثمنء هي المنظمات ذات أفضل قيمة من البيانات الضخمة. ومجرد حدوث 
الدمج والمزج» فإن هيكل البيانات (مثل: جداول البيانات» أو قاعدة البيانات» أو 
مستودع البيانات» أو نظام ملفات مجاني مثل هادوب» أو جميعها في نفس الوقت) 
يصبح غير مهم؛ وهذا يعني أنك لست بحاجة إلى معرفة تفاصيل كيفية مستودعات 
البيانات لطرح الأسئلة والإجابة عليها. وكما رأينا في حالة عملية »)٤-۷(‏ أن حملة 
أوباما وجدت طريقة لدمج وسائل التواصل الاجتماعيء والتقنية. وقواعد بيانات 
البريد الإلكتروني» وجمع البيانات» وبيانات السوق الاستهلاكية لعمل ميزة تنافسية. 
الحوكمة: lla)‏ كانت حوكمة البيانات مشكلة صعبة في مجال تقنية المعلومات. 
ومع ظهور البيانات الضخمة أصبح الأمر أكثر حيرة. وهناك أكثر من ۸٠‏ دولة لديها 
قوانين لخصوصية البيانات. وقد حدد الاتحاد الأوروبي سبعة «مبادئ خصوصية للملاذ 
الآمن» لحماية بيانات مواطنيهم الشخصية. ففي سنغافورة بدأ تفعيل قانون حماية 
البيانات الشخصية ds .Y-W uUo d‏ الولايات المتحدة الأمريكية يؤثر Sarbanes-‏ 
e Oxley‏ جميع الشركات المدرجة في البورصة» ويضع قانون 111044 (قانون نقل 
التأمين الصحي والمُساءلة وقابلية النقل) المعايير الوطنية في مجال الرعاية الصحية. 
ويختلف التوازن الصحيح بين التحكم والتجريب تبعًا لاختلاف التنظيم والصناعة. 
ويبدو أن أفضل ممارسات إدارة البيانات الرئيسة تساعد في إدارة عملية الحوكمة. 
/- التبشير: فمن خلال الحصول على دعم من واحد أو أكثر من الرعاة التنفيذيين» 
يستطيع ابمبشرون مثلك الحصول على الكرة ا متداولة وغرس مجموعة فاضلة: فكلما 
olj‏ عدد الإدارات في منظمتك والتي تحقق فوائد قابلة للتطبيق» تصبح التحليلات 
أكثر انتشارًا عبر منظمتك. وتُعد التحليلات المرئية السريعة والسهلة في الاستخدام 
هي المفتاح الذي يفتح الباب أمام تبني التحليلات والتعاون على نطاق المنظمة. 
Sources: Lampitt, A. (2012). Big data visualization: A Big deal for eBay. infoworld.‏ 
com/d/Big-data/Big-data-visualization-Big- deal-ebay-208589 (accessed August‏ 
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2016). Tableau white paper. (2012). 7 Tips to Succeed with Big Data in 2013. 
cdnlarge.tableausoftware.com/sites/default/files/whitepapers/7-tips-to-succeed- 


with-Big-data-in-2013.pdf (accessed August 2016). 


أستلة للمراجعة على القسم 1-۷: 

-١‏ ما المقصود بمشهد موردي البيانات الضخمة؟ ومن هم اللاعبون الكبار؟ 

-١‏ في رأيك كيف سيتغير مشهد موردي البيانات الضخمة في المستقبل القريب؟ وماذا؟ 
ba -Y‏ دور التحليلات المرئية في عالم البيانات الضخمة؟ 


۷-۷ البيانات الضخمة وتحليلات التيار: 


تُعد السرعة من أهم الخصائص الرئيسة التي تميز البيانات الضخمة إلى جانب خاصيتي الحجم 
والتنوع, GLUI‏ رأيناهما سابقًا في هذا الفصلء وتشير السرعة هنا إلى السرعة التي يتم بها إنشاء 
البيانات وتدفقها إلى بيئة التحليلات. وتبحث المنظمات عن وسائل جديدة لمعالجة تيار البيانات 
عندما تأقي للاستجابة بسرعة وبدقة على المشاكل والفرص من أجل إرضاء عملائهم والحصول على 
ميزة تنافسية. وفي الحالات التي تأ فيها تيارات البيانات بشكل سريع وبصورة مستمرة: فإنه 
غالبًا ما تصل طرق التحليل التقليدية التي تعمل مع البيانات المتراكمة سابقًا (أي البيانات في حالة 
الراحة) إلى قرارات خاطئة بسبب استخدام الكثير من البيانات خارج السياق» أو تصل هذه الطرق 
إلى القرارات الصحيحةء ولكن بعد فوات الوقت الذي تحتاج المنظمة إلى استخدامها فيه. لذلك؛ 
فإنه من المهم في العديد من مواقف العمل أن يتم تحليل البيانات بعد وقت قصير من إنشائها 
و / أو بمجرد أن يتم بثها في نظام التحليلات. 

ومن المفترض أن أغلب الأعمال في العصر الحديث تعيش حاليًا على مبدأ أنه من المهم 
والضروري تسجيل كل جزء من البيانات؛ لأنه رها يحتوي على معلومات قيمة قد يحتاج إليها 
العمل الآن أو في وقت ما في المستقبل القريب. وكيفما يزداد عدد مصادر البيانات» فإن نهج 
«تخزين كل شيء» يصبح أصعب وأصعبه بل إنه قد يكون غير ممكن في بعض الحالات. وفي 
الواقع. فإنه على الرغم من التقدم التقنيء إلا أن سعة التخزين الإجمالية الحالية DiS clis‏ 
عن المعلومات الرقمية التي يتم إنتاجها في العام. وعلاوةٌ على ذلك فإن الكشف المستمر عن 
التغييرات ذات الدلالة في البيانات بالإضافة إلى الاختلافات الُعقدة للأنماط ضمن نافذة زمنية 
قصيرة معينة في الوقت المناسب في بيئة الأعمال المتغيرة» يُعد Dol‏ ضروريًا للتوصل إلى الإجراءات 
التي تتلاءم بشكل أفضل مع البيئة الجديدة. ومما سبق يتبين أن كل هذه الحقائق التي ذكرت 
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تُعد هي المحفز الرئيس لظهور نموذج يُُسمى بتحليلات التيار. وقد ظهر نموذج تحليلات التيار 
كاستجابة لكل هذه التحديات, وبالتحديد. التدفقات غير المحدودة من البيانات التي لا يمكن 
تخزينها بشكل دائم ليتم تحليلها Cigi G ÉY‏ اممناسب وبكفاءة. بالإضافة إلى تحدي التغيرات 
النمطية المعقدة التي تحتاج إلى الكشف عنها والتصرف فور حدوثها. 

ويُستخدم مصطلح تحليلات التيار (ويس مى أيضًا تحليلات البيانات في الحركة والتحليلات 
الفورية للبيانات) عادةً من أجل العملية التحليلية الخاصة باستخراج معلومات قابلة للتطبيق 
من بيانات التيار / البيانات المتدفقة بشكل متواصل. ويُعرف التيار بأنه تسلسل مستمر لعناصر 
.)7١1 «95, 2s Zikopoulos) LG‏ وغالبًا ما تُسمى عناصر البيانات في مجموعة ما 
بالصفوف tuples‏ بمعنى قاعدة البيانات العلائقية. حيث يشبه #امناا صفًا من البيانات (سجل, 
موضوع. مثال). ومع ذلك فإنه في سياق البيانات شبه اللهيكلة أو غير اطهيكلة, 5$ tuple‏ 5 
عبارة عن تجريد يمثل حزمة من البيانات» والتي هكن وصفها بأنها مجموعة من السمات مموضوع 
معين. فإذا كان عامنا بحد ذاته غير واف با معلومات الكافية للتحليل أو الارتباط أو العلاقات 
الجماعية الأخرى بين الصفوف المطلوبة» فعندئذ يتم استخدام نافذة للبيانات تتضمن مجموعة 
من الصفوف 5ع1منا. هذه النافذة من البيانات عبارة عن عدد / تتابع محدود من الصفوف 
tuples‏ حيث يتم تحديث النوافذ باستمرار كلما توافرت بيانات جديدة. ويتم تحديد حجم 
النافذة بناءً على النظام الجاري تحليله. وقد أصبح انتشار تحليلات التيار متزايدًا لسببين. أولهماء 
أن قيمة وقت العمل أصبحت في تناقص مستمرء وأما ثانيهماء أننا لدينا الوسائل التقنية لالتقاط 
ومعالجة البيانات أثناء إنشائها. 

وقد تم تطوير بعض التطبيقات التي تُعد أكثر تطبيقات تحليلات التيار تأثيرا في صناعة الطاقة, 
وتحديدًا من أجل أنظمة الشبكات الذكية (سلسلة إمدادات الطاقة الكهربائية). فالشبكات 
الذكية الجديدة لا يمكنها فقط إنشاء ومعالجة تيارات متعددة للبيانات في الوقت المناسب من 
أجل التوزيع الأمثل للطاقة لمقابلة احتياجات العملاء الحقيقية: بل إنها أيصًّا هكنها إنشاء تنبؤات 
دقيقة على المدى القصير تهدف إلى تغطية الحاجات الملحة غير المتوقعة وتوليد الطاقة المتجددة. 
ويوضح الشكل )١7-1(‏ صورة حالة استخدام عامة لتحليلات التيار في صناعة الطاقة (تطبيق 
الشبكة الذكية النموذجي)»» والغرض من ذلك هو التنبؤ بدقة بالطلب على الكهرباء وإنتاجها 
في الوقت المناسب باستخدام بيانات التيار التي توفرها العدادات الذكية وأجهزة استشعار نظام 
الإنتاج ونماذج الرصد. ويمكن استخدام كل من القدرة على التنبؤ باتجاهات الاستهلاك / الإنتاج 
في ا مستقبل القريب بالإضافة إلى اكتشاف الحالات الشاذة في الوقت المناسب من أجل تحسين 
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قرارات التوريد (كمية الإنتاج» وموارد الإنتاج المستخدمة. وتعديل قدرات الإنتاج على النحو 
الأمثل) بالإضافة إلى ضبط العدادات الذكية لتنظيم الاستهلاك والتسعير الملائم للطاقة. 





قرارات السعة نظام إنتاج الطاقة 
| ( تقليدى وقابل للتجديد) | 
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شكل 19-0: حالة استخدام تحليلات التيار في صناعة الطاقة 


تحليلات التيار مقابل التحليلات الدائمة: 

قد يبدو لمعظم الناس أن كلا المصطلحين التيار والدائم هما الشيء نفسه. كما أنهما يستخدمان في 
كثير من الحالات بشكل مترادفء غير أنه يوجد اختلاف بينهما في سياق الأنظمة الذكية (2007 ,85ه0]). 
فتحليلات التيار تنطوي على تطبيق منطق مستوى المعاملات إلى المشاهدات الفورية؛ حيث إن 
القواعد المطبقة على هذه الملاحظات تأخذ في اعتبارها الملاحظات السابقة طاما أنها وقعت في 
النافذة المقررة؛ وتحتوي هذه النوافذ على حجم عشوائي (مثل: آخر 0 ثوا وآخر ٠١٠٠١‏ ملاحظة). 
وعلى الجانب الآخرء فإن التحليلات الدائمة تقوم بتقييم كل مشاهدة واردة في مقابل كل المشاهدات 
السابقة» حيث لا يوجد حجم نافذة. ومن الجدير بالذكر أن التعرف على كيفية ارتباط المشاهدة 
الجديدة بجميع المشاهدات السابقة يُمَكّن من تكوين رؤية في الوقت المناسب. 

ولكل من تحليلات التيار والتحليلات الدائمة مزاياها وسلبياتها وأماكنها الخاصة في عالم تحليلات 
الأعمال. فعلى سبيل المثالء أحيانًا تكون أحجام المعاملات كبيرة للغاية ويكون وقت اتخاذ القرار قصيراً 
جد مما يؤدي إلى تفضيل عدم الثبات وأحجام النوافذ الصغيرة» والتي ثترجم إلى تحليلات التيا في 
حين أنه عندما تكون المهمة خطيرة ويمكن إدارة وحدات التخزين في الوقت المناسبء فعندئذ تكون 
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التحليلات الدائمفة هي الخيار الأفضل. وبهذه الطريقةء فإنه يمكن الإجابة على A‏ من نوع: «ما 
علاقة ما تعلمته للتو بما كنت أعرفه؟» «هل هذا Qa» «Sega eios‏ الذي يحتاج إلى المعرفة؟». 


معالجة الأحداث الحرجة: 

إن معالجة الأحداث الحرجة هي طريقة التقاطء وتتبّع. وتحليل تيارات البيانات للكشف عن 
الأحداث (التي تكون خارج الأحداث العادية) لأنواع معينة تستحق الجهد المبذول. وتُّعد معالجة 
الأحداث المعقدة تطبيقا لتحليلات التيار والتي يتم فيها جمع البيانات من مصادر متعددة 
لاستنتاج الأحداث أو أنماط الاهتمام إما قبل حدوثها بالفعل أو بمجرد حدوثها. والهدف من ذلك 
هو اتخاذ إجراءات سريعة من أجل منع حدوث الآثار السلبية لهذه الأحداث أو التخفيف منها 
(مثل: الاحتيال أو اختراق الشبكات). أو في حالة وجود بصيص أمل من الفرصةء فيكون الهدف 
هو الاستفادة الكاملة من الموقف في الوقت المسموح به (بناءً على سلوك المستخدم على موقع 
التجارة الإلكترونية» وإنشاء عروض ترويجية والتي يُرجح أن يستجيب لها المستخدم). 

وقد تقع هذه الأحداث الحرجة عبر طبقات مختلفة من المنظمة مثل العملاء ا محتملينء أو 
الطلبات» أو مكالمات خدمة العملاء» أو على نطاق أوسع: والذي قد يكون عناصر إخبارية» أو رسائل 
نصية» أو منشورات وسائل التواصل الاجتماعيء أو تغذيات سوق الأوراق امالية» أو تقارير حركة 
المرورء أو الأحوال الجوية» أو غيرها من أنواع الحالات الشاذة التي قد يكون لها تأثير كبير على 
تحسين حالة المنظمة. كما يمكن أيضًّا تعريف الحدث بشكل عام على أنه «تغيير الحالة», والذي قد 
يتم اكتشافه على أنه قياس يتجاوز بداية محددة في وقت سابق» أو درجة الحرارة أو قيمة أخرى. 
وعلى الرغم من أنه لا يوجد إنكار لاقتراح القيمة الخاصة بمعالجة الأحداث الحرجة. إلا أنه يتعين 
انتقاء ما يجب قياسه» ومتى يتم القياس» وكم مرة يتم القياس. وبسبب الكم الهائل من المعلومات 
المتوفرة حول الأحداث» والتي يشار إليها أحيانًا باسم سحابة الحدثء فإن هناك احتمال للمبالغة 
فيهاء وفي هذه الحالة فإنها قد تضر بالفعالية التشغيلية لامنظمة» بدلا من مساعدتها. 


التنقيب في تيار البيانات: 

يمكن تعريف التنقيب في تيار البيانات» باعتباره تقنية مكينية لتحليلات التيارء على أنه عملية 
استخراج الأنماط الجديدة وهياكل المعرفة من سجلات البيانات السريعة والمتواصلة. وكما رأينا 
في فصل التنقيب في البيانات (الفصل الرابع)» فإن الطرق التقليدية للتنقيب في البيانات تتطلب 
جمع البيانات وتنظيمها في شكل ملف مناسبء ثم يتم معالجتها بطريقة متكررة لمعرفة الأنمماط 
الأساسية. وعلى النقيض من ذلكء فإن تيار البيانات هو تدفق مستمر لتسلسل مرتب من النماذج 
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التي يمكن قراءتها / معالجتها في كثير من التطبيقات الخاصة بالتنقيب في تيار البيانات مرة واحدة 
فقط أو عدد قليل من المرات باستخدام قدرات محدودة للحوسبة والتخزين. وتشتمل أمثلة تيار 
البيانات على بيانات جهاز الاستشعارء وزيارات شبكة الحاسب. وال محادثات الهاتفية. ومعاملات 
6 وبحث الويب. والبيانات المالية. ويعتبر التنقيب في تيار البيانات حقلا فرعيًا من التنقيب 
في البيانات» وتعلم الآلة واكتشاف المعرفة. ١‏ 

ويتمثل الهدف في العديد من تطبيقات التنقيب في تيار البيانات» في التنبؤ بالدرجة أو القيمة 
الخاصة بالنماذج الجديدة في تيار البيانات التي توفر بعض المعرفة حول عضوية الفئة أو قيم 
النماذج السابقة في تيار البيانات. ويمكن استخدام أساليب تعلم الآلة المتخصصة (ومعظمها 
مشتقة من أساليب تعلم الآلة التقليدية) لتعلم مهمة التنبؤ من الأمثلة المصنفة بطريقة آلية. 
Kimg Kletkeg Delen go JS eb 459‏ )2005( بتطوير مثال على طريقة التنبق حيث قاموا 
تدريجيًا ببناء وصقل نموذج لشجرة القرار باستخدام مجموعة فرعية من البيانات في وقت واحد. 
أستلة للمراجعة على ۷-۷: 
-١‏ ما هو التيار (في عام البيانات الضخمة)؟ 
۲- ما هي الدوافع لتحليلات التيار؟ 
ls -Y‏ هي تحليلات التيار؟ وكيف تختلف عن التحليلات العادية؟ 
-٤‏ ما هي معالجة الأحداث الحرجة؟ وكيف ترتبط بتحليلات التيار؟ 
-٥‏ عرف التنقيب في تيار البيانات. ما هي التحديات الإضافية التي يطرحها التنقيب في تيار البيانات؟ 


A-V‏ تطبيقات تحليلات التيار: 

إن استخدام تحليلات التيار يتخذ اتجاهًا متزايدًا بشكل كبير. وذلك نظرًا لقدرته على إحداث 
رؤية حاليةء مما يساعد صانعي القرار على التواجد على قمة الأحداث عندما يتوسعونء الأمر 
الذي يتيح للمنظمات معالجة القضايا قبل أن تتحول إلى مشكلات. وفيما ياي بعض مجالات 
التطبيق التي استفادت بالفعل من تحليلات التيار. 
التجارة الإلكترونية: 

تحاول العديد من الشركات تحقيق أقصى استفادة من البيانات التي تجمعها أثناء وجود 
العميل على موقع الويب الخاص بهاء مثل Amazon à$ S‏ وشركة eBay‏ )2 بين العديد من 


ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري wi‏ 


الفصل السابع 


الشركات الأخرى). حيث يتم تسجيل وتحليل كل صفحة تتم زيارتهاء وكل منتج تمت مشاهدته. 
وكل عملية بحث أجريت» بالإضافة إلى كل نقرة يتم عملهاء وذلك لزيادة القيمة المكتسبة من 
زيارة ا لمستخدم. فإذا تم القيام بذلك بسرعةء فإن تحليل مشل هذا التيار من البيانات يمكنه 
تحويل المتصفحين إلى مشترين والمشترين إلى مدمني تسوق. فعندما نقوم بزيارة موقع للتجارة 
الإلكترونية على الويب» حتى وإن لم نكن أعضاءً فيه فإننا بعد عدة نقرات» نبدأ في الحصول 
على عروض أسعار منتجات وحزم مثيرة للاهتمام بشكل كبير. ويتم خلف الكواليس بشكل 
فوري إجراء التحليلات المتقدمة للبيانات الناتجة عن نقراتناء وآلاف النقرات من الآخرين» 
«لفهم» ما نحن مهتمون به (في بعض الحالات. حتى ولو م نكن نعرف ذلك) وتحقيق أقصى 
استفادة من هذه المعلومات من خلال تقديم عروض إبداعية. 
الاتصالات الهاتفية: 

إن حجم البيانات التي تأي من سجلات تفاصيل المكاللمات (0210©) لشركات الاتصالات: أمر 
مدهش. وعلى الرغم من أن هذه المعلومات قد اس تُخدمت لأغراض إعداد الفواتير منل فترة 
ليست بالقصيرة, إلا أن هناك ثروة من المعرفة المدفونة في عمق هذه البيانات الضخمة والتي 
تدركها شركات الاتصالات الآن. فعلى سبيل المثالء يمكن تحليل بيانات 01016 لمنع تحول العملاء 
إلى شركة أخرى عن طريق تحديد الشبكات الخاصة بالمتصلين, والمؤثرين. والقادة, والمتابعين 
داخل هذه الشبكات والعمل على هذه المعلومات بشكل استباقي. وكما نعلم جميعًاء فإن 
للقادة وللمستخدمين المؤثرين تأثيرًا كبيرًا في تغيير نظرة المتابعين داخل شبكتهم نحو مقدم 
الخدمة. سواء بشكل إيجابي أو سلبي. وتقوم شركات الاتصالات بتحديد القادة وأصحاب النفوذ 
والمشاركين في شبكاتهم لإدارة قاعدة عملائهم بشكل أفضل وذلك باستخدام أساليب تحليل 
الشبكات الاجتماعية. كما يمكن بالإضافة إلى ذلك استخدام هذه المعلومات أيضًا لاستقطاب 
أعضاء جدد ورفع قيمة الأعضاء الحاليين إلى أقصى حد. 

ويمكن دمج التيارات المستمرة من البيانات التي تأتي CDR oa‏ مع بيانات وسائل التواصل 
الاجتماعي (تحليل المشاعر) من أجل تقييم فعالية الحملات التسويقية. كما يمكن استخدام 
الأفكار المكتسبة من هذه التيارات الخاصة بالبيانات للتفاعل السريع مع التأثيرات الضارة (التي 
قد تؤدي إلى فقدان العملاء) أو تعزيز وقع التأثيرات الإيجابية المشاهدة في هذه الحملات (والتي 
قد تؤدي إلى تعظيم عمليات الشراء للعملاء الحاليين واستقطاب dde bes (ou e Mas‏ 
ذلك» فإنه يمكن تكرار عملية اكتساب الأفكار من 011 من أجل شبكات البيانات التي تستخدم 
سجلات تفصيلية لبروتوكول الإنترنت. ونظرًا لقيام معظم شركات الاتصالات بتوفير كلا النوعين من 
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هذه الخدمات. فإن التحسين الشامل لجميع العروض والحملات التسويقية قد يؤدي إلى مكاسب 
استثنائية في السوق. وتُعد حالة عملية (۷-۷) مثالا على كيفية فهم <دمء.ع©:521510 لعملائه 
بشكل أفضل من خلال الاعتماد على تحليل تيارات النقر. 


حالة عملية ۷-۷ 
استخدام 531651050 لتيار البيانات لتحسين قيمة العميل 

وسعت شركة 5316540568 خدمات السحابة التسويقية الخاصة بها لتشمل النتائج 
التنبؤية ومميزات الجمهور التنبؤية وتسمى بالتسويق السحالبي التنبؤي. وتستخدم هذه 
الإضافة بيانات التيار الفورية لتحسين تفاعل العملاء عبر الإنترنت. أولّاء يحصل العملاء 
على درجة تنبؤية فريدة لهم» ويتم احتساب هذه النتيجة من عدة عوامل مختلفة. 
وتشمل كلا من طول مدة سجل التصفح» وما إذا كانوا قد قاموا بالنقر على رابط البريد 
الإلكترونيء وما إذا كانوا قد قاموا بشراء مادي» وكم أنفقواء ومنذ متى قاموا بالشراء وما 
إذا كانوا قد استجابوا لأي بريد إلكتروني أو حملة إعلانية. وبمجرد حصول العملاء على 
درجة» يتم تقسيمهم إلى مجموعات مختلفة؛ حيث يتم إعطاء هذه المجموعات Éh‏ 
وأهدافًا تسويقية مختلفة Blaze!‏ على السلوكيات التنبؤية الخاصة بكل منهم» ويتم 
تحديث الدرجات والشرائح وتغييرها يوميًا مع إعطاء الشركات خارطة طريق أفضل 
لاستهداف وتحقيق الاستجابة المطلوبة. وتعد هذه الحلول التسويقية أكثر دقة كما أنها 
تتيح طرقًا أكثر تخصيضصًا للشركات والتي يمكنها استيعاب أساليب الاحتفاظ بالعملاء. 

أسئلة للمناقشة: 

-١‏ هل هناك مجالات في أي صناعة يكون فيها تيار البيانات غير ذي صلة؟ 

-٠‏ بخلاف الاحتفاظ بالعملاء ما هي المزايا الأخرى لاستخدام التحليلات التنبؤية؟ 

ماذا نتعلم من هذه الحالة العملية؟ 

تستطيع الشركات من خلال تحليل البيانات التي تم الحصول عليها في المكان والزمان 
المناسبَينء أن تقوم بتنبؤات وتتخذ قرارات بشأن المستهلكين بسرعة أكبر. مما يضمن 
تحقيق أهداف الأعمالء وجذب العملاء المناسبينء والاحتفاظ بهم وتعظيم قيمتهم 
لأقصى حد. ومن الجدير بالذكر أن البيانات التي تم الحصول عليها في الأسبوع الماضي» 
ليست مفيدة مثل البيانات التي لدى الشركات اليوم. كما أن استخدام البيانات ذات 
الصلة يجعل تحليلنا التنبؤي أكثر دقة وكفاءة. 
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Sources: Amodio, M. (2015). Salesforce adds predictive analytics to Marketing Cloud. 
Cloud Contact Center  http//www.cloudcon-tactcenterzone.com/topics/cloud 
contact-center/articles/413611-salesforce-adds-predictive analytics-marketing- 
cloud.htm (accessed July 2016). Davis, J. (2015). Salesforce adds new predictive 
analytics to Marketing Cloud. Information Week. http://www.informationweek.com/ 
Big-data/Big-data analytics/salesforce-adds-new-predictive-analytics-to marketing- 
cloud/d/d-id/1323201 (accessed July 2016). Henschen, D. (2016). Salesforce reboots 
Wave Analytics, preps IoT cloud. ZD Net. http://www.zdnet.com/article/salesforce- 
reboots-wave-analytics-preps-iot-cloud/(accessed July 2016). 


تطبيق القانون والحماية الإلكترونية: 

توفر تيارات البيانات الضخمة فرصًا ممتازة لتحسين سبل منع الجريمة. وتطبيق القانون» 
وتعزيز الأمان. فهي توفر إمكانات مذهلة في مجال تطبيقات الأمن التي هكن بناؤها في الفضاء 
مثل الوعي الظرفي الفوريء والمراقبة متعددة الوسائطء وكشف الأمان الإلكتروني» والتصنت على 
المكامات الهاتفية» ومراقبة الفيديوء والتعرف على (Y MY (59,25 Zikopoulos) 429Jl‏ 
مجال إنتاج الطاقة: 

تزداد كمية البيانات التي تم جمعها بشكل فوري عن طريق مرافق الطاقة, أضعافًا مضاعفة, 
بسبب زيادة استخدام العدادات الذكية. فقد انتقلت من مرة كل شور لتصبح مرة كل ١0‏ 
دقيقة (أو بشكل أكثر تكرارًا)» حيث تجمع قراءة العداد كميات كبيرة من البيانات القيمة مرافق 
الطاقة. حيث ترسل هذه العدادات الذكية وغيرها من أجهزة الاستشعار الموضوعة في جميع 
أنحاء الشبكة الكهربائية» المعلومات إلى مراكز التحكم ليتم تحليلها فور وصولهاء حيث تساعد 
مثل هذه التحليلات شركات المرافق لتحسين قرارات سلاسل التوريد الخاصة بهم (مثل: تعديل 
السعة: وخيارات شبكة التوزيع؛ والشراء أو البيع الفوري) وذلك من خلال الاعتماد على أنماط 
الاستخدام والطلب للمستهلكينء بالإضافة إلى أن شركات المرافق يمكنها دمج بيانات الطقس 
والظروف الطبيعية الأخرى في تحليلاتها لتحسين توليد الطاقة من مصادر بديلة (مثل: الرياح» 
والطاقة الشمسية) وتوقع Gof‏ مُقدار الطلب على الطاقة في عمليات الحبيبات الجغرافية 
المختلفة. كما أن هناك فوائد أخرى مشابهة تنطبق على المرافق الأخرى كامياه والغاز الطبيعي. 
الخدمات المالية: 

تُعد شركات الخدمات المالية من بين أبرز الأمثلة التي يمكن أن توفر تحليلات تيار البيانات 
الضخمة لها قرارات أسرع وأفضلء بالإضافة إلى الميزة التنافسية التي تقدمها لهاء وكذلك الرقابة 
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التنظيمية. فهي توفر القدرة على تحليل البيانات السريعة المتدفقة» والأحجام الضخمة من بيانات 
التداول عندما يكون وقت الاستجابة منخفض للغاية عبر الأسواق والدولء فضلًا عن تقدهها لميزة 
هائلة بشأن قرارات الشراء / البيع من النوع جزء من الثانية والتي يمكن أن ثُتَرجم إلى مكاسب مالية 
كبيرة. وبالإضافة إلى قرارات الشراء / البيع المُثلى» فإن تحليل البيانات يمكنه أيضًا أن يساعد شركات 
الخدمات المالية في مراقبة التجارة بشكل فوري للكشف عن التزوير وغيره من الأنشطة غير القانونية. 
علوم الصحة: 

تستطيع الأجهزة الطبية حديثة العهد (مثل: أجهزة تخطيط القلب ول معدات التي تقيس 
ضغط الدم» ومستوى الأكسجين في الد ومستوى السكر في الدم» ودرجة حرارة الجسم) أن تنتج 
بيانات تشخيصية / حساسة ذات قيمة عالية معدل سريع للغاية؛ حيث إن تسخير هذه البيانات 
وتحليله ا فور إنتاجها يقدم فوائد - من النوع الذي نطلق عليه غالبًا «مسألة حياة أو موت» - 
وذلك على عكس أي مجال آخرء فضلًا عن مساعدة شركات الرعاية الصحية لكي تصبح أكثر فعالية 
وكفاءة (مما يترتب عليه أن تصبح هذه الشركات أكثر تنافسية وقادرة على تحقيق أرباح عالية)» 
وتعمل تحليلات التيار أيضًا على تحسين ظروف المرضى وإنقاذ الأرواح. 

تقوم العديد من أنظمة المستشفيات في جميع أنحاء العام بتطوير البنية التحتية للرعاية 
وأنظمة صحية مستقبلية. وتهدف هذه الأنظمة إلى الاستفادة بشكل كامل مما تقدمه التقنية 
بل وأكثر من ذلك. إن استخدام الأجهزة التي تولد بيانات عالية الدقة معدل سريع للغاية إلى 
جانب أجهزة الحاسب فائقة السرعة التى يمكنها تحليل تيارات البيانات المتعددة بشكل متوازن» 
يؤدي إلى زيادة فرص الحفاظ على سلامة المرضى من خلال سرعة اكتشاف الحالات الشاذة. 
وتهدف هذه الأنظمة إلى مساعدة صانعي القرارات الخاصة بالبشر على اتخاذ قرارات أسرع 
وأفضل من خلال الاطلاع على عدد كبير من المعلومات بمجرد توفرها. 


الحكومة: 

تسعى الحكومات في جميع أنحاء العالم إلى إيجاد طرق ترفع من فعاليتها (من خلال الاستخدام 
الأمشل للموارد المحدودة) وأكثر فاعلية (بتوفير الخدمات التي يحتاجها الناس ويريدونها). ومع 
تحول ممارسات الحكومة الإلكترونية إلى الاتجاه السائد, إلى جانب الاستخدام واسع النطاق لوسائل 
التواصل الاجتماعي والوصول إليهاء فإن ذلك يوفر كميات ضخمة من البيانات (المهيكلة وغير 
المهيكلة) لتصبح تحت تصرف الجهات الحكومية. فالاستخدام السليم لتيارات البيانات الضخمة 
في الوقت المناسب هو الذي بميز الجهات الاستباقية ذات الكفاءة العالية عن غيرها من الجهات 
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التي مازالت تستخدم الطرق التقليدية للتفاعل مع المواقف عند حدوثها. كما أن هناك طريقة 
أخرى تستطيع الجهات الحكومية من خلالها الاستفادة من قدرات التحليلات الفورية وهي إدارة 
الكوارث الطبيعية مثل العواصف الثلجيةء والأعاصيرء والرياح الشديدة» وحرائق الغابات من خلال 
مراقبة تيار البيانات الصادر من أجهزة الرادارء وأجهزة الاستشعارء وأجهزة الكشف الذكية الأخرى. 
كما يمكنهم أيضًا استخدام أساليب مشابهة لرصد جودة OLLI‏ وجودة الهواء» وأنماط الاستهلاك 
واكتشاف أي حالات مختلفة عن المعتاد قبل أن تصبح مشاكل كبيرة. وبالإضافة إلى ما سبق» فإن 
هناك مجالًا آخر تستخدم فيه الجهات الحكومية تحليلات التيار وهو مجال المرورء حيث تستخدم 
هذه التحليلات في إدارة حركة المرور في المدن المزدحمة؛ حيث يمكن للجهات الحكومية أن تغير 
إشارات المرور الضوئية وحارات ال مرور لتخفيف الإزعاج الذي تسببه مشاكل الازدحام المروريء 
وذلك باستخدام البيانات الصادرة عن كاميرات تدفق حركة المرورء وبيانات ال 625 التي تصدر 
عن اللركبات التجارية» وأجهزة استشعار حركة المرور الموجودة في الطرق. 


أسئلة للمراجعة على القسم ۸-۷: 

-١‏ ما هي أكثر الصناعات فائدة لتحليلات التيار؟ 

؟- كيف يمكن استخدام تحليلات التيار في التجارة الإلكترونية؟ 

- بالإضافة إلى ما ذكر في هذا القسم. هل يمكنك التفكير في صناعات و / أو مجالات تطبيق أخرى 
يمكن استخدام تحليلات التيار فيها؟ 

ع- بالمقارنة مع التحليلات العادية. هل تعتقد أن تحليلات التيار ستحتوي على حالات استخدام 
أكثر (أو أقل) في عصر تحليلات البيانات الضخمة؟ ولاذا؟ 


تلخيص لأهم نقاط الفصل: 

- للبيانات الضخمة معانٍ مختلفة بالنسبة للأشخاص ذوي الخلفيات والاهتمامات المختلفة. 

- تتخطى البيانات الضخمة نطاق بيئة الأجهزة المستخدمة و / أو إمكانيات أدوات البرامج 
ال مستخدمة في جمعها وإدارتها ومعالجتها خلال فترة زمنية مقبولة. 

- عادةٌ ما يتم تعريف البيانات الضخمة من خلال ثلاث 77: الحجم variety g glg volume‏ 


„velocity ås Jlo 
لتقسيم المعالجة ملفات البيانات الضخمة متعددة الهيكلة عبر‎ Golv MapReduce yas - 
تجمع كبير من الآلات.‎ 
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- يعتبر هادوب إطار عمل مجاأني لمعالجة وتخزين وتحليل كميات كبيرة من البيانات المقسمة غير اللهيكلة. 
- يعتبر ©1119 تخزين بيانات مبني على هادوب - يشبه إطار عمل تم تطویره أصلًا بواسطة )00 ط٤٤‏ ۴۵. 

- يعتبر 218 لغة استعلام مبنية على هادوب تم تطويرها بواسطة 0وطهلا. 

- تعتبر 1[ ©7105 والتي ترمز ل.آ50 (Not Only‏ 554 جديدًا لتخزين ومعالجة كميات 
ضخمة من البيانات غير المهيكلة وشبه المهيكلة ومتعددة الهيكلة. 

- يعتبر عام البيانات hg Data scientist‏ جديدً! أو وظيفةٌ جديدة ترتبط عادةً بالبيانات 
الضخمة أو علم البيانات. 

- تعتبر كلّ من البيانات الضخمة ومستودعات البيانات تقنيات متكاملة (وليست متنافسة) للتحليلات. 

- كمجال جديد نسبيّاه يتطور مورد البيانات الضخمة بشكل Mr gu jo‏ 

- تعتبر Stream analytics jLzl cXudes‏ مصطاحًا يُستخدم عادةٌ لاستخراج المعلومات القابلة 
للتطبيق من مصادر البيانات المتدفقة باستمرار. 

- تعمل التحليلات الدائمة على تقييم كل مشاهدة داخلة في مقابل جميع المشاهدات السابقة. 

- تعتبر معالجة الأحداث الحرجة طريقة لالتقاط وتتبع وتحليل تيارات البيانات لاستكشاف 
أحداث معينة (بخلاف الأحداث العادية) والتي تستحق هذا المجهود. 

- يعرف التنقيب في تيار البيانات» كتقنية تمكينية لتحليلات التيارء على أنه عملية لاستخراج 
الأنماط الجديدة وهياكل ال لعرفة من سجلات البيانات المستمرة والسريعة. 

















مصطلحات أساسية: 

البيانات الضخمة. التنقيب في تيار البيانات. Hive‏ 
تحليلات البيانات الضخمة. .MapReduce -Hadoop‏ 
معالجة الأحداث الحرجة. ملف هادوب المقسم. .NoSQL‏ 
نظام (HDFS)‏ التحليلات الدائمة. -Pig‏ 

تحليلات التيار. علماء البيانات. 














ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري awy‏ 


الفصل السابع 


أسئلة للمناقشة: 

-١‏ ما هي البيانات الضخمة؟ وماذا تعتبر مهمّة؟ ومن أين تأني؟ 

۲- في رأيك» ما هو مستقبل البيانات الضخمة؟ وهل ستفقد شعبيتها إلى شيءٍ آخر؟ إذا كانت 
الإجابة بنعم» فماذا سيكون ذلك الشيء؟ 

۴- ما هي تحليلات البيانات الضخمة؟ وكيف تختلف عن التحليلات العادية؟ 

-٤‏ ما هي العوامل المهمة لنجاح تحليلات البيانات الضخمة؟ 

5- ما هي التحديات الكبيرة التي يجب مراعاتها عند اعتماد تنفيذ تحليلات البيانات الضخمة؟ 

1- ما هي مشاكل الأعمال الشائعة التي تعالجها تحليلات البيانات الضخمة؟ 

/- في عصر البيانات الضخمة. هل نعتبر بصدد نهاية عصر مستودعات البيانات؟ وطاذا؟ 

8- ما هي حالات استخدام البيانات الضخمة / هادوب ومستودعات البيانات / 11081/5؟ 

-١‏ ما هي تحليلات التيار؟ وكيف تختلف عن التحليلات العادية؟ 

-٠‏ ما هي أكثر الصناعات المجدية لتحليلات التيار؟ وما هو القاسم المشترك بين تلك الصناعات؟ 

-١‏ باممقارنة مع التحليلات العاديةء هل تعتقد أن تحليلات التيار ستحتوي على حالات استخدام 

أكثر (أو أقل) في عصر تحليلات البيانات الضخمة؟ وماذا؟ 


تمارين - شبكة جامعة تيراداتا (TUN)‏ وغيرها من التمارين اليدوية: 

teradatauniversitynetwork.com (JI «3l -Y‏ وابحث عن دراسات الحالة. قم بقراءة 
الحالات والأوراق البيضاء التى تتحدث عن تحليلات البيانات الضخمة. ما هى الفكرة الرئيسة 
المشتركة بين دراسات الحالة تلك؟ ] 

«teradatauniversitynetwork.com à -Y‏ ¢ بإيجاد الأوراق البيضاء ل تحليلات 54S‏ المرئية 
ودراسات الحالةء والتدريبات اليدوية. قم بإجراء تمارين التحليلات المرئية على مجموعات 
البيانات الضخمة ثم قم بإعداد تقرير لمناقشة النتائج التي توصلت إليها. 

teradatauniversitynetwork.com à -Y‏ اذهب إلى صفحة 21خ 0115م5. قم بإيجاد 
تطبيقات البيانات الضخمة في الرياضة. لخص النتائج التي حصلت عليها. 

gblàa 5s C. 2uls teradatauniversitynetwork.com |J] «231 -€‏ 9).3 851 التي تتکلم 
عن البيانات الضخمة. راجع هذه المقاطع. ثم أجب عن أسئلة الحالة المتعلقة بها. 


WA‏ ذكاء الأعمال والتحليلات وعلم البيانات» منظور إداري 


مفاهيم وأدوات البيانات الضخمة 


5- اذهب إلى موقعي saod sl asterdata.coms teradata.com‏ قم بإيجاد على الأقل ثلاث دراسات 
حالة عملاء على البيانات الضخمة» واكتب تقريرًا تناقش فيه أوجه الشبه والاختلاف بين هذه الحالات. 
1- اذهب .IBM.com Jl‏ قم بإيجاد على الأقل ثلاث دراسات حالة عملاء على البيانات الضخمة 
واكتب تقريرًا تناقش فيه أوجه الشبه والاختلاف بين هذه الحالات. 
/ا- اذهب إلى .daudera.com‏ € بإيجاد على الأقل ثلاث دراسات حالة عملاء على تنفيذ 
هادوب» واكتب تقريرًا تناقش فيه أوجه الشبه والاختلاف بين هذه الحالات. 
8- اذهب إلى eà .mapr.com‏ بإيجاد على الأقل ثلاث دراسات حالة عملاء على تنفيذ هادوب. 
واكتب تقريرًا تناقش فيه أوجه الشبه والاختلاف بين هذه الحالات. 
-hortonworks.com (J] «4a3l -‏ قم بإيجاد على الأقل ثلاث دراسات حالة عملاء على تنفيذ 
هادوب» واكتب تقريرًا تناقش فيه أوجه الشبه والاختلاف بين هذه الحالات. 
-٠‏ اذهب إلى 221:110816.6002. قم بإيجاد على BY‏ ثلاث دراسات حالة عملاء على تنفيذ 
هادوب» واكتب تقريرًا تناقش فيه أوجه الشبه والاختلاف بين هذه الحالات. 
-١‏ اذهب إلى e Cio! .youtube.com‏ مقاطع فيديو عن حوسبة البيانات الضخمة. شاهد 
اثنين منهم على الأقل. لخُص النتائج التي حصلت عليها. 
-١1'‏ اذهب إلى :012داء0816.02/5مع وابحث عن مقالات عن تحليلات التيار. قم بقراءة ثلاث 
مقالات منها على الأقل. لخّص النتائج الخاصة بك. 
؟١-‏ ادخل على 134وداء800816.602/5: وابحث عن مقالات عن التنقيب في تيار البيانات. قم 
بقراءة ثلاث مقالات منها على الأقل. لخَّص النتائج الخاصة بك. 
-١‏ ادخل على 0137ا“3/5زهت.عاع8008: وابحث عن مقالات تتكلم عن البيانات الضخمة في مقابل 
مستودعات البيانات. قم بقراءة خمس مقالات منها على الأقل. لخّص النتائج الخاصة بك. 
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الاتجاهات المستقبلية والخصوصية 
والاعتبارات الإدارية في التحليلات 


أهداف التعلم: 
- استكشاف بعض التقنيات حديثة الظهور التي قد توثر على التحليلات» وذكاء الأعمالء ودعم القرار. 
- وصف الظاهرة حديثة الظهور ال معروفة باسم إنترنت الأشياء (IoT)‏ والتطبيقات المحتملة, 
والنظام الاقتصادي لظاهرة (إنترنت الأشياء). 

- وصف الاستخدام الجاري والمستقبلي للحوسبة السحابية في تحليلات الأعمال. 
- وصف كيفية مساعدة التحليلات المبنية على الجغرافية المكانية والموقع للمنظمات. 
- وصف التأثيرات التنظيمية لتطبيقات التحليلات. 
- سرد ووصف القضايا الأخلاقية والقانونية الرئيسة لتنفيذ التحليلات. 
- تحديد الخصائص الرئيسة لمحترفي علم البيانات الناجح. 

يقدم هذا الفصل عدة تقنيات حديثة الظهور والتي من المحتمل أن تكون ذات تأثيرات جوهرية 
على تطوير واستخدام تطبيقات ذكاء الأعمال. وفي مجال حركي كالتحليلات» فإن المصطلحات أيضًا 
تتطور وتتداخل. وكما سبق ذكره فيمكننا الرجوع إلى هذه التقنيات مثل ذكاء الأعمال أو 
التحليلات» أو علم البيانات» أو تعلم الآلةء أو الذكاء الاصطناعي (41)» أو الحوسبة ال معرفية. أو 
البيانات الضخمة: أو العديد من العناوين الأخرى. وليس هدفنا هو التركيز على الفروق الطفيفة 
بين كل منهاء ولكن الهدف هوالتعامل معهم جميعًا ككوكبة كبيرة واحدة. إننا نركز على بعض 
الاتجاهات التي تحققت بالفعل وعاى البعض الآخر المتوقع أن يؤثر بصورة أكبر على التحليلات. 
ودائمًا ما يعد استخدام كرة كريس تال اقتراحًا منذرًا بالخطرء ولكن في ه ذا الفصل نقدم تحليلًا 
لبعض المجالات النامية. كما نقدم ونشرح بعض التقنيات حديثة الظهور وكذلك نستكشف بعض 
تطبيقاتها المعاصرة. ثم نناقش بعد ذلك التأثيرات التنظيمية والشخصية والقانونية والأخلاقية 
والاجتماعية لأنظمة الدعم التحليلي والقضايا التي يجب أن يهتم بها مديرو ومحترفو التحليلات. 
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(Siemens) مقال افتتاحى: تحليل بيانات الاستشعار يساعد سيمنس‎ ١-6 
على تجنب أعطال القطارات:‎ 

تعتبر شركة 51680625 أكبر منتج في العام لتقنيات كفاءة الطاقة وتوفير الموارد. يقع المقر 
الرئيسي للشركة في برلين بأمانياء بعائدات 38 مليار دولار سنويًا. تنتج Siemens‏ قطارات متنوعة 
ومكونات بنية تحتية تشبه أنظمة التحكم وأنظمة الطاقة. 

يعتقد فريق خدمات نقل البيانات التابع لشركة 51652625 أن تحليلات البيانات الضخمة 
وإنترنت الأشياء (101) يستطيع أن يمكنهم من توقع أخطاء المكونات لأسابيع قادمة. إنهم 
يستكش فون هذه الأساليب للتأكد من عدم ترك أي قطار محجوز على المسارات بسبب أعطال 
فنية غير متوقعة. وتريد 51670685 الانتقال من الصيانة التفاعلية (بعد الحادث) والصيانة 
الوقائية (بعمليات التفتيش المنتظمة) إلى الصيانة التنبؤية للقطارات. 

تقيس أجهزة الاستشعار المتصلة بمكونات قطاراتها الموقف الحالي للمكونات» حيث تقوم شركة 
5 بجمع وتحليل بيانات جهاز الاستشعار بشكل فوري تقريبًا. وإذا تم العثور على أي شذوذ 
في البيانات» فهذا يشير إلى احتمال عطل أحد المكونات. وبالتالي» هكن اتخاذ تدابير وقائية وفقًا لذلك. 

وفقًّا لمدونة تيراداتاء يعتمد مهند سو 51641265 على بيانات عشرات الآلاف من أجهزة الاستشعار. 
تذهب كل من بيانات القطارات والسكك الحديدية» وبيانات عمليات الإصلاح» وبيانات الطقس» 
وبيانات سلاسل التوريدء إلى بنية البيانات الموحدة تيراداتا التابعة لشركة 51670675 للاستفادة من 
Teradata Asterg Hadoop‏ ومستودع بيانات تيراداتا. وصرح ووع15 06250 مدير فريق 
خدمات نقل البيانات بشركة ÜE Siemens‏ « لا يمكننا أن نفعل ما نفعله بناءً على بنية مختلفة 
لأن أحجام البيانات لدينا كبيرة جدًا. ولذا؛ فمثلًا بالنسبة لأسطول سيارات من أوروباء قمنا بجمع 
كل بيانات أجهزة الاستشعارء وكانت حوالي ٠٠١‏ مليار سطرًا جدوليًا. وإذا كنت ترغب في تنفيذ 
خوارزمية تعلم الآلة على ذلك فهي لا تعمل على شيء ليس موازياً بشكل كبير». 

يسمح تعلم الآلة باستخدام بيانات جهاز الاستشعار لعلماء ومهندمي البيانات بشركة 
35 من الكشف السريع عن الإيجابيات الخاطئة (التنبؤ بعطل لا يحدث فعلًا) وإعطاء 
تنبؤ واضح بأعطال الجزء الفعلي. ولأن الإنذارات الكاذبة تكون أكثر من الإنذارات الحقيقية, 
تقوم المنظمة بالنظر في أوامر العمل, والأرقام التسلسلية» وتاريخ بيانات القطارات والخدمات» 
ومعلومات التشخيص. وبيانات جهاز الاستشعارء وعمليات الإصلاح» وبيانات سلاسل التوريد 
للمساعدة في تحديد وحل أعطال الجزء الحقيقي. وتستطيع 5 أن تحدد بدقة أيهما 
أكثر عرضة للعطل» هل هو القطار فائق السرعة بين موس كو وسانت بتسبرج في الشتاء القارس 
أم القطار فائق السرعة في إسبانيا الحارة في أيام Usg ainal‏ عن طريق دمج بيانات الطقس. 
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يستخدم مشغل القطار ce pu) Jie Siemens jUaàJ à, LI cbss Li RENFE Ql LI‏ 
Valero E‏ الخاضع للمراقبة المستمرة من Siemens «ale‏ فإذا كانت أهاط بيانات جهاز الاستشعار 
التي تم جمعها غير طبيعية» يتم إرسال فريق للتحقق من هذه المكونات» وبالتالي يمنع عطل القطار 
على المسارات. وكنتيجة لذلكء لم يتأخر بشكل ملحوظ سوى قطار واحد فقط من أصل 7٠١‏ قطار. 
وتزعم 5162605 أيضًّا أن المصداقية المرتفعة لقطاراتها قد ساعدت الكثير من مشغلي القطارات على 
تحسين أدائهم فيما يتعلق بالوقت المناسب. فعلى سبيل ال مثالء تعمل قطارات بانكوك بنسبة تأخير 
١‏ فقط. وتقدّر ol eDÀS Siemens‏ التشغيلات التى بمكن الاعتماد عليها بشكل كبير بين برشلونة 
ومدريد قد أدت إلى زيادة معنوية في عدد ركاب القطارات وتقليص حركة الملاحة الجوية. 

وهكذاء تكون النمذجة التنبؤية قد منحت 51640605 فرصة خدمية جديدة. لقد تم تأسيسها 
الآن كمورد رئيس لخدمة تتبع أعطال القطارات. وسيصبح بيع هذه الخدمات التنبؤية أكثر 
أهمية من مجرد المعدات الأصلية. 


ما هى الدروس التى يمكننا تعلمها من هذه المقالة الافتتاحية؟ 
تقود Siemens‏ تطوير الخدمات الإضافية والقيمة للمنتجات الصناعية الضخمة القادمة من 
الصناعات الكبيرة نسبيًا؛ إذ يمكن للشركة إنشاء صورة أفضل لطريقة أداء منتجاتها على أرض الواقع» 
وذلك من خلال استعمال أجهزة الاستشعار التي تولد كميات كبيرة ومتنوعة من البيانات ودمج تلك 
البيانات مع مصادر البيانات الأخرى مثل الطقس. وعلاوةً على ذلك فإن تحليل مثل هذه البيانات 
قد يساعد العميل على أداء الصيانة فقط عندما يلزم ذلك وليس وفقًا لجدول زمني. ولقد أصبح بيع 
Jia‏ هذه الخدمات التحليلية محور اهتمام أساسي جديد بالنسبة لجميع المنتجين الرواد للمعدات 
الصناعية مثل 5دعدمءذ5 General Electrics‏ کما یعتبر بیع خدمات أداء التحليلات على المنتجات 
والصيانة التنبؤية أو الإصلاحات مثالًا ممتازًا لإنشاء فرص تسويقية جديدة للمنتجات القائمة. 
أسئلة للمناقشة: 
-١‏ في مجال المعدات الصناعية مثل القطارات» ما هي الَعْلَّمات التي يمكن قياسها بانتظام لتقدير 
الأداء الحالي للمعدات والإصلاحات اللازمة مستقبلا؟ 
؟- كيف يمكن أن نستفيد من بيانات الطقس في تحليل حالة معدات القطارات؟ 
*- قدّر كمية البيانات التي تحتاج لجمعها في شهر واحد باستخدام مثلًا ٠٠٠١‏ جهاز استشعار على 
قطار واحد, علمًا بأن كل جهاز استشعار يعطي ١‏ كيلوبايت من البيانات في الثانية الواحدة. 
-٤‏ ما هو تصورك لتخزين مثل هذه المجموعات من البيانات؟ 
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۸ إنترنت الأشياء: 

قدمت المقالة الافتتاحية مجالًا يواجه نموًا كبيرا في الوقت الراهن. يعتبر إنترنت الأشياء (101) 
ظاهرة لربط العام المادي بالإنترنت» بخلاف إنترنت الأشخاص الذي يربط البشر ببعضهم البعض 
من خلال التقنية. ففي إنترنت الأشياءء تتصل الأجهزة المادية بأجهزة الاستشعار التي تجمع بيانات 
عن الجهاز مثل التشغيل والموقع والحالة الراهنة. تتم معالجة هذه البيانات باستخدام أساليب 
تحليلية متنوعة بلراقبة الجهاز عن بُعد من مكتب مركزي أو للتنبؤ بأي أخطاء قد تحدث للجهاز. 
ولعل المثال الأشهر على إنترنت الأشياء هو السيارة ذاتية القيادة. ولي تقود نفسها بنفسهاء تحتاج 
السيارة وجود أجهزة استشعار كافية لمراقبة الموقف تلقائيًًا من حولها وتتخذ الإجراءات الملائمة 
لضبط أي إعداد لازم» ها في ذلك سرعة السيارة واتجاهها وما إلى ذلك. ومن الأمثلة الشائعة الأخرى 
على إنترنت الأشياء هو جهاز متتبع اللياقة الذي يسمح للمستخدم بتتبع أنشطته الجسدية كالمشي 
والجري والنوم. وتعد شركة ١اه"‏ مثالا آخر لتوضيح ظاهرة إنترنت الأشياء. فقد قامت 
binاSma‏ بتطوير حاويات القمامة ذات أجهزة استشعار للكشف عن مستويات الامتلاء؛ حيث 
يقوم جهاز الاستشعار بإخطار شركة جمع القمامة تلقائيًا بأن الحاويات قد امتلأت تقريبًا وتحتاج 
للتفريغ. وبالطبع يعد المثال الأكثر شيوعًا الذي يضربه الناس لتوضيح إنترنت الأشياء هو فكرة 
طلب الثلاجة للحليب تلقائيًا عندما تكتشف أن الحليب قد نفد. وقدمت شركة كلوروكس فلتر 
8 الجديد المزود بوعاء به 1071-51 يستطيع طلب فلاتر الياه بنفسه عند اكتشاف وقت التغيير. 
في كل هذه الأمثلة, لا يضطر البشر إلى التواصل مع بعضهم البعضء ولا حتى مع أي آلة في كثير 
من الحالات؛ حيث تستطيع الآلات أن تتكلم. وهذا هو سبب استخدام مصطلح إنترنت الأشياء. 

Juniper La léig‏ (72017)» فبالإضافة إلى أجهزة التابلت والهواتف الذكية والحواسيب 
الشخصيةء سيتم ربط أكثر من 8 مليار شيء بالإنترنت وذلك بحلول عام .٠١٠١‏ وفيما يلي بعض 
الأسباب للنمو الكبير في إنترنت الأشياء: 
-١‏ كون الأجهزة أصغر حجمًا وأرخص سعرا وأكر قوة: لقد انخفضت كاليق الشغلات وأجهزة الامتشعار 

بشكل كبير في العشر سنوات المنصرمة» مما أدى بشكل عام لإنتاج جهاز استشعار أرخص كثيرا. 


؟- إمكانية التنقل الرخيصة: وقد انخفضت كذلك تكاليف معالجة البيانات والسعة التنزيلية 
وأجهزة الجوال بنسبة ٩۷‏ منذ العقد الماضي. 


Source: Adapted from teradata.com (2016). The Internet of trains. http:// www.teradata.com/resources/ 
case-studies (accessed August 2016); theit.org. (2016). Siemens tracks Big Data for trains that keep on 
running. http:// eandt.theiet.org/magazine/2016/07/siemens-Big-data-trains.cfm (accessed August 2016); 
Siemens.com (2016). About Siemens. http:// www.siemens.com/about/en/(accessed August 2016). 
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-Y‏ توافر أدوات ذكاء الأعمال: تعرض الآن الكثير والكثير من الشركات أدوات ذكاء الأعمال الخاصة 
بها سواء على أجهزتها أو على السحابة بمعدلات أقل. وتكون أدوات البيانات الضخمة وذكاء 
الأعمال متاحة على نطاق واسع وبصورة متطورة للغاية. 

-E‏ تظهر يوميًا بشكل افتراضي حالات استخدام جديدة ومثيرة. 


كما ينبغي علينا ملاحظة وجود بعض التعارض حول استخدام مصطلح إنترنت الأشياء. وأيضًا 
يطلق عليه البعض مصطلح 55« 288 Web of Things sU.‏ ويسميه البعض الآخر إنترنت الأنظمة 
لأنه في العديد من الطرق سيكون هناك توليفة من الأنظمة التي تتواصل فيما بينها. عمومًاء سنشير 
في هذا الفصل لهذه الظاهرة باسم إنترنت الأشياء (101) لتحقيق الاتساق. 
وتختلف التقديرات على نطاق واسع فيما يخص نمو صناعة إنترنت الأشياءء في حين سيتم 
إنفاق مبلغ يتراوح ما بين تريليون ١١9‏ تريليون دولار تقريبًا على حلول إنترنت الأشياء بقدوم 
عام P-Y‏ والتي تعد واحدة من أسرع قطاعات تقنية المعلومات نموًا بشكل عام وعنصرًا أساسبًا 
في صناعة التحليلات. وتعطي الحالتان العملیتان (۱-۸) و(۲-۸) مثالين لتطبيقات إنترنت الأشياء 
في صناعات مختلفة باستخدام منصتين تقنيتين مختلفتين. 
حالة عملية ١-8‏ 
شركة زوارق 511761110016 تستخدم تحليل البيانات الفوري 
لإخطار المتسابقين وا مشجعين 
تعتبر زوارق 511765110016 إحدى أسرع القوارب في العام والأكفأ في استهلاك الطاقة 
والتي تصنعها شركة تحمل نفس الاسم. وتستخدم زوارق 51176511001 في جميع 
سباقات الزوارق حول العالم. تواجه القوارب المنطلقة بسرعات عالية ضد اللياه المالحة 
خطر عطل المعدات. ويعتمد المتسابقون على بيانات القياس عن بُعد من قواربهم 
لاتخاذ قرارات تتعلق بالسلامة والتخطيط. وفي بعض المواقفء يتم أيضًّا جمع بيانات 
القياس الحيوية للمتسابقين. وبالتاليء يستقبل المتسابقون الكثير من المعلومات. مما 
يُصعُب تتبع كل البيانات. كما لاحظت 51176110016 أن جمهور سباقات الزوارق كانوا 
يواجهون صعوبة بلتابعة المتسابقين في المحيطء كلما انطلقت القوارب بسرعة. مما قلل 
من تعلق الجمهور باللعبة. وقد جمعت 5117511001 البيانات من 8١‏ جهاز استشعار 
ولكن لم تكن هناك طريقة سهلة للحصول على أفكار لتحسين قدرات اتخاذ القرار 
واتخاذ قرارات السلامة وتحسين تجربة الجمهور. 
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استخدم فريق 5117110016 منصة عخدمء 811 1816 كخدمة 2225 (انظر القتسم 
التالي) لاستخدام حلول تحليلات 181/5855 وتوصيل أفكار مفهومة للمستخدمين 
والجماهير. وقد تمكنت 511972110016 عن طريق 2285 من إنشاء تطبيقات. وسحب 
بيانات في السحابة. وإجراء التحليلات المطلوبة على تلك البيانات. واستخدم 181/1 
Bluemix‏ بالاشتراك مع شركة Virtual Eye‏ قاعدة إنترنت الأشياء لإرسال بيانات 
الاستشعار المتولدة من أجهزة الاستشعار ونظام تحديد المواقع العالمي (685) إلى 
السحابة. وقد تم إجراء تحليل على بيانات جهاز الاستشعار باستخدام أدوات التحليل 
الموجودة في «تنسعسا8 1881. كما قامت ع1 [دائز؟ بتوصيل تنبيهات المعلومات 
الفنية للفريق المتسابق والتمثيل الفوري للسباق إلى الجماهير. والآن يستطيع 
المتسابقون الحصول على رؤية فورية عن السباقء لتحسين قراراتهم وقدرتهم التنافسية. 

-١‏ ما هو نوع المعلومات المهمة للمتسابقين والتي يمكن أن تنشتها أجهزة الاستشعار 
على قارب السباق؟ وماذا عن الجماهير؟ 

؟- ما هى الرياضات الأخرى التى يمكن أن تستفيد من تقنيات مشابهة؟ 

-Y‏ ما هي التحديات التقنية التي يمكن أن تواجهها في إنشاء مثل هذه الأنظمة؟ 
Sources: IBMBigdatahub.com. (2015). SilverHook Powerboats: Tracking fast-moving‏ 
boats in real time. http://www.ibmBigda-tahub.com/blog/silverhook-powerboats-tracking-‏ 
fast-moving-powerboats-real-time (accessed August 2016); IBM.com (2015). Case study:‏ 
SilverHook Powerboats. http://www.ibm.com/cloud-computing/case studies/silverhook-‏ 


powerboats.html (accessed August 2016).‏ 
حالة عملية ۲-۸ 
شركة Auton a01‏ اRoekwe1‏ تراقب أصول استكشاف النفط والغاز غالية الثمن 

تعتبر شركة das ill dala wy Oè x51 sao] Rockwell Automation‏ الآلی 
الصناعي والمعلومات الصناعية في العاط؛ إذ ينتشر عملاؤها في أكثر من 6١‏ دولة حول 
العام ويعمل بها حوالي ۲۲٠٠١‏ موظف. وترتكز الشركة في عملها على عدة مجالات» يعد 
أحدها مساعدة شركات النفط والغاز في الامتكشاف. ومن أمثلة ذلك شركة ممء111 
Energy‏ وهي شركة تقوم بالتنقيب عن النفط في ألاسكاء وهي تستخدم معدات غالية 
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الثمن جدًا في الحفر والاستخراج وتكرير النفطء ويمكن لعطل واحد في المعدات أن يكلف 
شركة النفط والغاز فاقد إنتاج بما يتراوح من ٠٠١‏ ألف إلى ٠١‏ ألف دولار في اليوم. 
ويتطلب التعامل مع هذه المشكلة وجود تقنية يمكنها مراقبة حالة مثل هذه المعدات عن 
بُعدء كما يمكنها التنبؤ با مشكلات التي من المحتمل أن تحدث بشكل جيد في وقت مبكر. 
Automation casi!‏ 10150611 هذه الفرصة لتوسيع أعمالها في صناعات النفط 
والغاز من خلال جمع البيانات من مواقع الاستكشاف وتحليلها لتحسين الكفاءة وقيادة 
الأداء بشكل أفضل. وتحصل الشركة على رؤيتها من ء15,مع1821 elsub Connected‏ 
إنترنت الأشياء التابعة لمايكروسوفت (811050501) لتوفير مراقبة ودعم معدات النفط 
والغاز التي تحتل مکانًا في مناطق بعيدة. وتوفر ۸٥ ek we11 ۸101٣۹10٩‏ الآن حلولًا 
للتنبؤ الفوري بأعطال المعدات على طول سلاسل توريد البترول» ومراقبة صحتها وأدائهاء 
والمساعدة في منع عطلها في المستقبل. وتتركز هذه الحلول في المجالات التالية: 

-١‏ الحفر: متلك شركة 7م8265 م.م 1111 معدات الضخ الخاصة بها المتمركزة 
في ألاسكاء حيث تقوم بالتنقيب عن النفط ١‏ ساعة في اليوم, ويمكن لعطل واحد في 
المعدات أن يكلف الشركة الكثير من المال. وقامت همناقتدماناخ Ja: Rockwell‏ 
المشغلات الكهربائية المتغيرة لمعدات الضخ بالسحابة (انظر القسم التالي)» بحيث يمكن 
التحكم في هذه الآلات على بعد آلاف الأميال من غرفة التحكم في أوهايو؛ إذ تقوم 
أجهزة الاستشعار بالتقاط البيانات» وتمريرها إلى Sb os Microsoft Azure Cloud‏ 
بوابة التحكم الخاصة بشركة 820618611 ثم تصل هذه البيانات إلى المهندسين التابعين 
Energy J‏ مده ه1111 من خلال لوحات معلومات رقمية» فتقوم لوحات المعلومات هذه 
بعرض معلومات عن الضغط ودرجة الحرارة ومعدل التدفق وعشرات المَعْلّمات الأخرى 
بشكل آني مما يساعد المهندسين على مراقبة صحة وأداء المعدات. كما تعرض لوحات 
المعلومات هذه تنبيهات عن أي مشكلات محتملة. فعندما تعطلت إحدى قطع معدات 
الضخ الخاصة بشركة م111160. تم تحديد العطل وتعقبه وإصلاحه في أقل من ساعة, 
مما أدى لتوفير 5 ساعات من تعقب العطل والتكلفة الناجمة عن فاقد الإنتاج. 

- بناء مضخات غاز أذى: في هذه الأيامء تقوم بعض شاحنات النقل باستخدام الغاز 
الطبيعي السائل كوقود. وتقوم شركات النفط بتحديث محطات تعبئة الوقود الخاصة بها 
لدمج مضخات الغاز الطبیعي السائل. کما قامت شرك Cadu Rockwell Automation‏ 
أجهزة استشعار ومشغلات تردد متغير على هذه الشاحنات لجمع بيانات فورية عن 
تشغيل المعدات ومخزون الوقود ومعدل الاستهلاك. وتتم إحالة هذه البيانات إلى منصة 
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السحابة الخاصة بشركة Rockwell‏ والتي تقوم بدورها بإنشاء لوحات معلومات تفاعلية 
وإعداد تقارير لوصف هذه التفاصيل dll uU] e3 555 Microsoft Azure elus Lob‏ 
المستفيدين الملائمينء مما يعطي انطباعًا مريخًا للمستفيدين عن سلامة أصول رأسمالهم. 

Ae Rockwell 45,5 (4 4sAàl! Connected Enterprise Jg 1o clase Az! 
زيادة سرعة نمو العديد من شركات النفط والغاز مثل شركة تإعمعم8 م:مء1111 من‎ 
خلال وضع بيانات العمليات الخاصة بها على منصة السحابة ومساعدتها على تقليل‎ 
التكلفة الناجمة عن أوقات الأعطال والصيانة. ونتج عن هذا ظهور فرص عمل جديدة‎ 
.Rockwell Automation Jٹûم للمصنعين الشجعان‎ 


أسئلة للمناقشة: 
-١‏ ما هو نوع المعلومات التي من المرجح أن يتم جمعها من قبّل منصة التنقيب 
عن النفط والغاز؟ 


۲- هل يتناسب هذا التطبيق مع الثلاث 1/5 (الحجم والتنوع والسرعة) الخاصة 
بالبيانات الضخمة؟ اذا نعم أو اذا لا؟ 

- ما هي الصناعات الأخرى التي يمكنها استخدام مقاييس تشغيلية ولوحات 
معلومات مشابهة؟ 
Sources: Customers.microsoft.com. (2015). Rockwell Automation: Fueling the oil‏ 
and gas industry with IOT. https;//customers.microsoft.com/Pages/CustomerStory.‏ 


aspx?recid-19922 (accessed August 2016); Microsoft.com. (n.d.). Customer stories| 
Rockwell Automation. https;//www.microsoft.com/en-us/cloud-platform/cus- tomer- 


stories-rockwell-automation (accessed July 2016). 

البنية التحتية لتقنية إنترنت الأشياء: 
من نظرة بعين الطائر, يمكن تقسيم تقنية إنترنت الأشياء إلى أربع مجموعات رئيسة والموضحة 

في الشكل (1-8) كما يلي: 

-١‏ الأجهزة (عتنه118:05): وتشمل الأجهزة المادية. وأجهزة الاستشعار. والمشغلات الميكانيكة 
التي يتم فيها إنتاج وتسجيل البيانات. والأجهزة هي المعدات التي تحتاج إلى التحكم فيها أو 
مراقبتها أو تتبعها. وقد تحتوي أجهزة الاستشعار الخاصة بتقنية إنترنت الأشياء على معالج 
أو أي جهاز حوسبة والذي يقوم بتوزيع البيانات الواردة. 
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-١‏ الاتصال (إاذاناء26م00): ينبغي أن يكون هناك محطة أساسية أو مركز رئيس يقوم بجمع 
البيانات من القطع المزودة بأجهزة الاستشعار وإرسال تلك البيانات إلى السحابة. يتم ربط 
الأجهزة بشبكة لتتواصل مع بعضها البعض أو مع تطبيقات أخرىء وقد يكون هذا الربط 
مباشر أو غير مباشر بالإنترنت. وتعمل البوابة على تمكين الأجهزة غير المتصلة مباشرةً بالإنترنت 
من الوصول إلى منصة السحابة. 

؟- الخلفية البرمجية (0معكء02 عنة50257): وفي هذه الطبقة, تتم إدارة البيانات التي تم 

؛ حيث تقو تقوم الخلفية البرمجية بإدارة الشبكات والأجهزة وتوفير تكامل البيانات. وقد 
يكون هذا جيدًا جدًّا في السحابة (انظر القسم التالي ثانية). 

-٤‏ التطبيقات: وفي هذا الجزء من إنترنت الأشياءء يتم تحويل البيانات إلى معلومات ذات معنى. 
وقد يتم تشغيل العديد من التطبيقات على الهواتف الذكية وأجهزة التابلت وأجهزة الحاسب 
الشخصي وتقوم بعمل شي مفيد مع البيانات. كما يتم تشغيل تطبيقات أخرى على الخادم 
ومن ثم تقديم نتائج أو تنبيهات من خلال لوحات المعلومات أو الرسائل إلى المختصين. 
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أجهزة استشعار التعريف بترددات الراديو REID‏ 


تعتبر تقنية التعريف بترددات الراديو(81110) واحدة من أقدم تقنيات الاستشعار الموجودة 
والتي تشهد هوًا كبيرًا. وتعتبر 8711 تقنية شاملة تشير إلى استخدام موجات تردد الراديو 
لتحديد الأهداف. وبشكل أساسيء تعد هذه التقنية مثالًا لعائلة تقنيات تحديد الهوية تلقائيًا 
والتي تشمل أيضًا الباركود والقضبان المغناطيسية واسعة الانتشارء حيث استخدمت سلاسل 
توريد التجزئة (والعديد من المجالات الأخرى) منذ منتصف السبعينيات تقنية الباركود كشكل 
أسامي لتحديد الهوية تلقائيًا. وقد روجت مزايا RFID‏ المحتملة لانتهاج هذه التقنية بقوة إلى 
العديد (Dillard'ss .Targets Wal-Mart Jia ijodi Spé yS boki) Sidi iya‏ 
كطريقة لتحسين سلاسل التوريد الخاصة بهم وبالتالي تقليل التكاليف وزيادة المبيعات. 

كيف تعمل تقنية 81:17؟ في أبسط صورة له. يتكون نظام (11:11 من علامة (متصلة بالمنتج المراد 
التعرف (asle‏ وأداة استجواب (بمعنى قارئ)» وهواني واحد أو أكثر متصلين بالقارئ» وجهاز حاسب 
(للتحكم في القارئ والتقاط البيانات). وحاليّاء بدأت سلاسل التوريد في الاهتمام أكثر باستخدام 
علامات ۸۴1۲ غير ا مباشرة؛ إذ تس تقبل العلامات غير المباشرة الطاقة من ا مجال الكهرومغناطيسي 
الذي أنشأته أداة الاستجواب (وليكن القارئ) وا معلومات المرتدة فقط عندما يتم طلبها. وتظل 
العلامة غير المباشرة نشطة فقط عندما تكون داخل المجال المغناطيسي لأداة الاستجواب. 

وفي المقابلء يكون لدى العلامات المباشرة بطارية على لوح مسطح لتنشيطها. وحيث إن لدى 
العلامات ال مباشرة مصدر طاقة خاصًا بهاء فهي لا تحتاج قارنًا لتنشيطها؛ بل يمكنها الشروع في عملية 
نقل البيانات من تلقاء نفسها. وبالمقارنة مع العلامات غير المباشرة, فإن للعلامات المباشرة نطاق 
قراءة أطول ودقة أفضل وتخزين معلومات أكثر تعقيدًا قابلًا لإعادة الكتابة. وقدرات معالجة أكثر 
UU Cabs 0555 d JUI 5525! 585 55Js .(Moradpour & Bhuptani, 2005) ;l; 5‏ 8 
بعض السلبيات» ومنها أن فترة حياتها تكون أقصرء وحجمها أكبر, وثمنها أغلى من العلامات غير 
المباشرة. وحاليّاه يتم تصميم وتشغيل معظم تطبيقات بيع التجزئة بعلامات سلبية. وغالبًا ما 
يتكرر وجود العلامات المباشرة في أنظمة الدفاع أو العسكريةء ولكنها تظهر كذلك في تقنيات مثل 
EZ Pass‏ حيث ترتبط العلامات بحساب مدفوع مقدمًاء مما تمَكّن السائقين من دفع الرسوم أثناء 
القيادة فقط بالمرور على القارئ بدلًا من التوقف للسداد عند كشك تحصيل الرسوم. 

يعد تمثيل البيانات الأكثر انتشارًا بالنسبة لتقنية 81:19 هو رمز المنتج الإلكتروني (8:20)» 
والذي ينظر إليه العديد من العاملين في الصناعة على أنه الجيل التاليي من رمز المنتج العالمي 
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(©112). والذي يتم تمثيله فی الغالب ہا یسمی بارکود. وکما ھوالحال فی ۰0۲٤‏ يتكون 1820 
من سلسلة من الأرقام التي تحدد أنواع المنتجات والمصنعين عبر سلاسل التوريد. كما يتضمن رمز 
820 مجموعة إضافية من الأرقام لتحديد العناصر بشكل فريد. 

وفي الوقت الحاليء تحتوي معظم علامات 8112 على 51 بايت من البيانات في شكل أرقام 
تعريف التجارة العالمية المسلسلة (56711215) لتحديد حالات أو رموز حاوية الشحن المسلسلة 
لتحديد لوحات التنزيل ule)‏ الرغم من إمكانية استخدام 5611215 أيضًّا لتحديد لوحات التنزيل). 
ويمكن إيجاد الدليل الكامل لوضع علامة معايير البيانات على موقع الويب الخاص بشركة 
.(epcglobalinc.org) s a5 EPCglobal‏ 2555 .; شركة 15820810521 منظمة يشترك في قيادتها 
رواد الصناعة والمنظمات التي تركز على إنشاء معايير عاطية ل E۲٥‏ لدعم استخدام RFID‏ 


وكما هو موضح في الشكل (Y-A)‏ تظهر بيانات العلامات في أنقى صورها عبارة عن سلسلة من 
SUI eL SI‏ والتي يمكن تحويلها بعد ذلك إلى المعادل العشري 56:1121. وكما يتضح؛ يعتبر 
121 بشكل أساسي 170 (1100-14 لتحديد حاوية الشحن) برقم مسلسل. ويعتبر الرقم 
المسلسل هو أهم فرق بين كل من ال ©1712 المكون من ١5‏ رقمًا المستخدم اليوم وبين GUI SGTIN‏ 
يتضمن علامة 8119. فمع 10805 يمكن للشركات تحديد عائلة المنتج التي تنتمي إليها الحالة (مثلء 
مناديل کارمن ۸ - عبوات)» ولكن لا يمكن تمييز عبوة واحدة من أخرى. أما مع 5061111 فيتم تحديد 
كل قطعة بشكل فريدء وهذا يوفر مستوى رؤية على مستوى القطعة: بدلا من مستوى عائلة المنتج. 


10100000000010111001111100001010011 00110000011 ثنائي 
1101110011010110010100011000 11001101010000000001 





الرقم المسلسل d‏ الصانع 


فحص الرقم pe py‏ متسر عشري 
(لیس مطلوبا ل ۸۴10) (GTN) 0023800 . 341813. p‏ 
(UPC) 3 0023800 41813 3‏ 





RFID Olly dode :Y-A JS. 
ويعد أحد تطبيقات الكميات الضخمة من البيانات المتولدة عن طريق 1112 في إدارة سلاسل‎ 
لتحسین‎ 0D تستطيع الشركات استخدام‎ GS .(Delen, Hardgrave, & Sharda, 2007) التوريد‎ 
«JUL كفاءة أو فعالية العمليات الحالية المتنوعة عن طريق التغيير التدريجي للعملية. فعلى سبيل‎ 
(Kat, 2006( اقترحت الأدلة الأولية إمكانية تخفيض وقت استلام المنتج في المستودع باستخدام‎ 
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RFID‏ فبدلًا من عمل مسح ضوي لكل قطعة من المنتج على انفراد باستخدام ماسح الباركود, 
يمكن قراءة المنتج ذي علامة REID‏ تلقائيًا على بوابة استلام المنتجات. وقدمت شركة جيليت تقريرًا 
بانخفاض وقت استلام لوحات التنزيل في مركز التوزيع الخاص بها من ٠١‏ ثانية إلى 0 ثوانٍ بفضل 
RFID‏ وإستراتيجية علامة - على - المصدر التابعة لها (2006 ,168]2). وم تتغير عملية الاستلام 
جذريًا (أي إن الرافعات الشوكية قامت بتفريغ المنتج كما كان من قبل). وكان التغيير الوحيد هو 
إزالة الحاجة للمسح اليدوي للمنتج. وبالتاليء أصبحت العملية أكثر كفاءة. كما يمكن زيادة فعالية 
العمليات. فمثلاء وجدت شركة :1821-1185 انخفاضًا بنسبة *"١‏ في المخزون باس تخدام بيانات 
RFID‏ لتوليد قوائم أفضل للمنتجات التي سيتم تجددla)& Hardgrave, Langford, Waller,‏ 
(Miller, 8‏ |3 $ تتغير عملية تجديد الرفء ولكن تم تحسينها باستخدام lS RFID‏ يستخدم 
RFID‏ لتقليل عدد الأخطاءء. مما يحسن دقة المخزونء ويؤدي في النهاية إلى تحسين التنبؤ والتجديد. 

وقد تم استخدام بيانات 8115 في العديد من التطبيقات المرتبطة الأخرى. فعلى سبيل المثال» 
تمثل البضائع القابلة للتلف أحد التحديات الكبرى لإدارة سلسلة التوريد بسبب العدد الكبير من 
المتغيرات ذات الخصائص المختلفة القابلة للتلف. ومتطلبات حساب تدفق البضائع في بعض 
سلاسل التوريدء وكميات كبيرة من البضائع التي يتم تداولها على مسافات طويلة. وعلى الرغم 
من أن الطعام يمثل الجزء الرئيس من قائمة المنتجات القابلة للتلفء إلا أن العديد من المنتجات 
الأخرى» كالزهور الحديثة والأدوية ومستحضرات التجميل وقطع غيار السيارات» وغيرهاء تتطلب 
ضوابط بيئية صارمة للإبقاء على جودتها. ونظرًا لأن حجم البضائع اللتداولة كبير جدّاء فتزداد 
احتمالية حدوث المشاكل )2007 dle elal wy LS (Sahin, Babaï, & Dallery Vaillant,‏ 
نسبة صغيرة من التلف مثلًاه من معنوية التحسن في سلاسل التوريد. ولذلك' تكون للإدارة المثلى 
لسلاسل توريد البضائع القابلة للتلف أهمية كبرى للشركات في هذا القطاع السوقي. 

يعتمد نجاح سلاسل التوريد سريعة الزوال اليوم على مستوى (وتوقيت) بروز المنتج. وينبغي 
أن يجيب هذا الظهور على أسئلة «أين المنتج الخاص بي؟» و«ما هو شرط المنتج الخاص بي؟». 
وبالفعل» شرعت العديد من الشركات في تجربة استخدام 81:15 للمواد القابلة للتلف. مع الوضع 
في الاعتبار كلا من الأمثلة التالية: 
- قامت شركة ساموورث برذارز (15عط]820 ]هم 52) للتوزيع (المملكة المتحدة؛ سندويشات 

وحلويات» إلخ) بإجراء مراقبة فورية لدرجة الحرارة في شاحناتها Swedberg, 2006a)‏ 


- تقوم ستاربكس باس تخدام تتبع درجات الحرارة لمنتجات إعداد الطعام المتجهة إلى منافذ بيع 
(Swedberg, 2006b) 45;2«Jl‏ 
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- تقوم ٥٥ء8‏ باستخدام RFID‏ لفحص شروط التنزيل دون فتح الأبواب (2005 ,قصنلام0). 

ولنا في إدارة جودة المنتج مثال آخر على استخدام ۸۴12 في سلاسل التوريد. فقد كشفت 
الدراسات التي تستخدم علامات 1511 القائمة على أجهزة الاستشعار في الشاحنات المزودة 
بمبردات والمخصصة لحمل ال مواد الغذائية أن درجة الحرارة فيها لم تكن ثابتة كما هو مفترضء 
بل تفاوتت .(Delen, Hardgrave, & Sharda, 2011) 5.5 Sui,‏ فقد تتغير البيئة مع انتقال 
المنتج عبر سلسلة التوريدء وهذا يؤثر على جودة وسلامة المنتج. وهنا يأ دور أجهزة الاستشعار 
البيئية التي RFID' es‏ ]5 توفر رؤية للظروف البيئية المتغيرة المحيطة بالمنتج كما توفر البيانات 
اللازمة لتحديد مدى تأثير تلك التغييرات على جودة أو سلامة المنتج. وبدون أجهزة استشعارء 
يمكننا الحصول على تقديرات متنوعة للظروف البيئية ولكن عند نقطة واحدة فقط دون أي رؤية 
ما بين تلك النقاط (على سبيل المثال. درجة الحرارة في وقت التنزيل» à»‏ وقت التسليم). وفي 
تطبيقات العينةء تختلف درجات الحرارة وفقًا لأشياء معينةء منها: 
- الموقع على لوح التنزيل (في الأعلى؛ في المنتصفء في الأسفل). 
- ترتيب التنزيل (أي موقع لوحات التنزيل). 
- نوع الحاوية. 
quis -‏ 
- مواد التغليف (صندوق مموج أو بلاستيك مقوى). 

ويقترح الأثر الملحوظ للعديد من المتغيرات ضرورة مراقبة البيئة بشكل مستمر لتحقيق الفهم 
التام للظروف المحيطة على مستوى لوح التنزيل و / أو القطعة. وبشكل عام فإن أجهزة استشعار 
(درجة الحرارة) الممكنة بتقنية ۸۴1۲ تعمل جيدًا وتوفر رؤية واسعة لا هكن الحصول عليها 
بتقديرات النقطة الواحدة للظروف التي تواجه المنتج عند مروره عبر سلاسل التوريد. والدرس 
المستفاد بشكل عام هو أن تقنية ۸۴1۳ تولد كميات ضخمة من البيانات التي يمكن تحليلها للحصول 
على أفكار عظيمة بشأن بيئة الشركةء وهذا هو الغرض الرئيس لقيام ذكاء الأعمال ودعم القرار. 
الحوسبة الضبابية: 

تعد إحدى أهم القضايا في إنترنت الأشياء هي أن البيانات التي تنتجها أجهزة الاستشعار بيانات 
ضخمة: ولكن ليست كلها مفيدة. إِذَاه ما هو القدر الواجب رفعه من البيانات الضخمة على 
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الخوادم السحابية لتحليلها؟ وتعتبر فكرة الحوسبة الضبابية هي المفهوم الجديد لحل هذا السؤال؛ 
حيث يقوم الضباب بتمديد السحابة لتكون أقرب إلى الآشياء التي تنتج وتعمل على بيانات إنترنت 
الأشياء. ويمكن وضع هذه الأجهزة والتي يطلق عليها عقد الضبابء في أي مكان بين ربط الشبكة. 
ويمكن لأي جهاز يتوفر له الحوسبة والتخزين والاتصال بالشبكة أن يكون عقدة ضباب» كأجهزة 
الراوتر أو المحولات. وفيما يلي توضيح لذلك: 

مركز البيانات / السحابة > جهاز الضباب > جهاز مادي / أجهزة استشعار لتوليد البيانات 

يؤدي تحليل البيانات بالقرب من الأجهزة إلى تقليل وقت الاستجابة. كما يحافظ أيضًا على 
السعة التنزيلية» إذ إن إرسال البيانات إلى السحابة يتطلب سعة تحميلية كبيرة. وتزداد أهمية 
الحوسبة الضبابية عندما تحتاج البيانات للتحليل في أقل من ثانية» كما هو الحال في حالة عطل 
النظام المتتالي. ويعرض الجدول )١1-8(‏ فرقين بسيطين بين السحابة والضباب. 


جدول 1-8: الفرق بين عقد الضباب ومنصة السحاب 








عقد الضباب منصة السحابة 
تستقبل البيانات من أجهزة إنترنت الأشياء. تستقبل وتجمع البيانات من عقد الضباب. 





تقوم بتنفيذ تحليلات إنترنت الأشياء في وقت | يتم إجراء التحليل على كميات ضخمة من بيانات 
الاستجابة باطللي ثانية. الأعمال والذي قد يستغرق ساعات أو أسابيع. 














كما قد تعطي الحوسبة الضبابية مزيدًا من الأمانء حيث يمكن تأمين عقد الضباب باستخدام 
نفس حل الأمان المستخدم في Oliy‏ تقنية المعلومات الأخرى. 
منصات إنترنت الأشياء: 

ولأن إنترنت الأشياء لايزال قيد التطوير, فإن العديد من منصات التقنية الخاصة بالمجال والتطبيقات 
تتطور أيصًا. وليست مفاجأة أن يكون العديد من الموردين الأساسيين لأنظمة إنترنت الأشياء هم نفس 
الموردين الذين يوفرون خدمات تحليل ومستودعات البيانات لمجالات التطبيق الأخرى» والتي منها: 
-Amazon AWS IoT -‏ 
Microsoft Azure IoT Suite -‏ 
-Predix IoT Platform by General Electric (GE) -‏ 
.IBM Watson IoT Jgl> -‏ 
-Teradata Unified Data Architecture -‏ 
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وقد عرضنا مثالًا على ذلك في المقالة الافتتاحية القسم .١-8‏ كما تقدم حالة عملية ۳-۸ تطبيقًا 
من منصة رئيسة أخرى لإنترنت الأشياء والتي تقوم بتسويقها جنرال إلكتريك. 
حالة عملية ۳-۸ 
التعاون المشترك بين بيتني باوز 80765 210 ومنصة General L i] Jli‏ 
101 ءنماءء81 لتحسين الإنتاج 

laios Pitney Bowes pis‏ الرئيس في ولاية Connecticut CSa‏ هي 
المورد الأمريي لحلول التجارة الإلكترونية ومنتجات الشحن والبريد. تقوم آلات الشركة 
بتشغيل أو إنتاج بمعدل ١10١‏ مليون قطعة بريد ق اليوم. Enterprise Mail agg‏ 
Busine‏ التابع ل esس80‏ ۵ا۴1 بتطویر وبیع وخدمة آلات كبيرة تسمى „Inserters‏ 
تساعد هذه الآلات البنوك ومقدمي الرعاية الصحية على وضع قطعة البريد الصحيحة 
في المظروف ذي المقاس الصحيح. بالنسبة لبنك واحد. قامت هذه الآلة بتجميع ٠٠٠‏ 
مليون قطعة بريد في السنة. وتنتج معظم الآلات ۲٠٠٠١‏ رسالة في الساعة. وبهذا 
المستوى من الإنتاج الآلي. تقوم 8005 ©ه]ز وعملاؤها أيضًا بإنتاج كمية ضخمة 
من البيانات كل يوم. وتسعى 8018065 /إ21]06 لتحليل البيانات المتولدة من آلات 
البريد هذه للتنبؤ بأعطال الآلات مقدمًا ومن ثم منع أي انقطاع للخدمة وإصلاح الآلات 
قبل أن تتعطل. وقد GE Predix Pitney Bowes cael‏ كمنصة سحابة مصممة 
للإنترنت الصناعي؛ إذ تقوم منصة ×ل٠٣‏ بتحليل بيانات جهاز الاستشعار للآلات 
وباستخدام التحليلات الفوريةء تقدم أفكارًا قوية تسهل اتخاذ القرارات. وبالإضافة إلى 
منع انقطاع الخدمة. تساعد التحليلات المقدمة من ذ8:64 على تقليل وقت العطل 
وبالتالي زيادة الإنتاجية. وقد أدى التحليل الشامل لبيانات جهاز الاستشعار الذي 
|J! Predix 4,25‏ زيادة الإنتاجية وتحسين أداء الآلات. 
Sources: News.pb.com. (2015). GE and Pitney Bowes join forces to bring the power‏ 
of the industrial Internet to the world of commerce. http;//news.pb.com/article display.‏ 
cfmfarticle id-5634 (accessed August 2016); GEreports.com. (2016). The power of Predix:‏ 
An inside look at how Pitney Bowes is using the industrial Internet platform. http://‏ 
www.gereports.com/the-power-of-predixan-inside-look-at-how-pitney-bowes-has-‏ 
been-using-the-industrialinternet-platform/; (accessed August 2016); GE.com (2016).‏ 


Making machines intelligent is smart business. http://www.ge.com/digital/sites/default/ 
files/ge digital predix pb brochure.pdf, (accessed August 2016); GE.com. (2015). The 
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industrial Internet, Pitney Bowes and GE. http://blogs.pb.com/corporate/201514/07//the 
industrialinternet-pitney-bowes-and-ge/(accessed August 2016). 


بدء النظام البيئي لإنترنت الأشياء: 


تشرع العديد من الشركات المبتدئة في الظهور في مجال إنترنت الأشياء وفي غضون ثلاث إلى 
أربع سنوات قادمة سنرى ازدهارًا Bos‏ في صناعة إنترنت الأشياء. وقد نما رأس المال ا مطروح في 
مشهد إنترنت الأشياءء من ١,8‏ بليون دولار في عام 011 إلى ۲,۵۹ بليون دولار في Y ele‏ ثم 
إلى 5,66 بليون دولار في عام 7010. ولعل من أبرز الأمثلة على الشركات الناشئة في إنترنت الأشياء: 
FreedomPops Jawbones Greenwaves Athoss Canarys 3D Roboticss Sigfox‏ 3 
„Ringo Razer‏ 

Fitbit a29‏ من أنجح شركات إنترنت الأشياء» وهي شركة أمريكية تقوم بتصنيع متتبعات 
النشاط, وأجهزة تقنية لاسلكية تستخدم أجهزة استشعار لتحديد عدد خطوات ال مشي» ومعدل 
القلب» وجودة النوم» وخطوات التسلقء وغيرها من مقاييس الصحة الشخصية. 

كما تقوم شركات الاتصالات أيضًا باستكشاف وترويج إنترنت الأشياء. ويسعى معظم كبار 
المشتغلين بالاتصالات Jio‏ 418:1 إلى الاستفادة من هذه التقنية. ولتوفير الاتصال بالسيارات» 
أبرمت :41841 شراكة مع 8 شركات أمريكية لتصنيع السيارات من أصل ٠١‏ شركات تعمل في هذا 
المجال. وتعرض العديد من شركات الاتصالات شبكات الجيل الخامس القادمة الخاصة بها كحجر 
أساس لإنترنت الأشياء. 

s Amazons Google/Alphabet 5a JS zs)‏ الأبرز في النظام البيئي لإنترنت الأشياء. 
كما تعد 7008[16) بسحابة 600816 التابعة لهاء و305.]آ 51061870116 (مدن ذكية) والسيارات ذاتية 
القيادة مستثمرًا رائدًا في العديد من مبادرات إنترنت الأشياء. وقد أنتجت 8123208 باستخدام 
خدمات الويب أمازون (4185) التابعة لها منصة جديدة لإنترنت الأشياء والتي يمكن أن تعمل 
كخلفية لإنترنت الأشياء. ويقدم الشكل (8-*) عرضًا موجرًا لمكونات النظام البيئي لإنترنت 
الأشياء. والذي يشتمل على مجالات التطبيق المختلفة» وصانعي الأجهزة. ومقدمي خدمة الاتصال» 
ومطوري البرمجيات» ومستشاري التحليلات» وما إلى ذلك» وهو مقتبس من مخطط النظام البيئي 
الذي تم تطويره http://mattturck.com/2016/03/28/2016-iot- :à 3544l Je alos‏ 
(QM odas È dbl ug) Matt Turck lyko (53 (55 landscape/‏ 
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Sources: Adapted from matt, T(March, 2016). Internet of Things: Are We There Yet? 
http://mattturck.com/2016/03/28/2016-iot-landscape/ (accessed August 2016) . 


شكل ۳-۸: النظام البيني لإنترنت الأشياء 

يتضمن هذا المخطط المفصل قائمة لشركات في كل مجموعة. ويبين الشكل (8-") أن فرص إنترنت 
الأشياء تتطور في ثلاثة قطاعات رئيسة؛ إذ تشتمل المجموعة الأولى على الشركات التي توفر مجموعات 
بناء تقنيات وأدوات تمكين إنترنت الأشياء (الأجهزة والبرمجيات والاتصال والمستشارين / الحاضنات / 
التحالفات / الشركاء). وتشمل المجموعة الثانية المنصات والواجهات والطباعة ثلاثية الأبعاد الحديثة 
وموردي التقنية / الخدمة المتحدينء ويمكننا أن نطلق على هذه المجموعة اسم (موردو الخدمة طمطوري 
إنترنت الأشياء - قطاع أفقي)» في حين تتألف المجموعة الثالثة من قطاعات الصناعة» وهي المنطقة التي 
ستكون إلى حد كبير تطبيقات في قطاعات مختلفة» وهي القطاع الشخصي والمنزل والمركبات وا مؤسسات 
والإنترنت الصناعي» حيث يقدم الشكل (8-؟) صورة واحدة لهذه المنظمة» بينما يتضمن موقع المدونة 
صورة مختلفة تتضمن أمثلة لشركات في كل من المجموعات الفرعية المحددة هنا. 
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اعتبارات إدارية فى إنترنت الأشياء: 


على الرغم من الإثارة الضخمة الدائرة حول نمو وإمكانية إنترنت الأشياء إلا أن هناك بعض 
القلق الذي ينبغي على المديرين الإمام به. وقد جمع معهد ماكنزي (رءء«ن)ءM)‏ العاطمي 

)۲۰٠٠(‏ دليلا تنفيذيًا ممتازًا لإنترنت الأشياء. 
ويحدد هذا التقرير القضايا التالية: 

-١‏ التوافق التنظيمي: على الرغم من صحة ذلك بالنسبة للكثير من مبادرات التقنية الأخرىء فمع 
إنترنت الأشياء فإن فرص التحسينات التشغيلية وإيجاد فرص أعمال جديدة تعني أنه يجب على 
موظفي تقنية المعلومات وموظفي التشغيل أن يعملوا كفريق واحد وليس في وظائف منفصلة. 
وكما لاحظ مؤلفو الدليلء «فإن إنترنت الأشياء سوف يتحدى المفاهيم الأخرى للمسؤوليات 
التنظيمية. كما ينبغي على مديري أقسام المالية والتسويق والتشغيلء بجانب قادة وحدات 
الأعمال, أن يكونوا متقبلين لربط أنظمتهم» (2015 رزءوصنكك3). 


-١‏ تحديات العمل المشترك: يشكل العمل المشترك ضررًا كبيرًا حتى الآن في نمو هذه الأنظمة؛ إذ 
لا تتصل جميع الأجهزة مع بعضها البعض بسلاسة. ثانيّه هناك الكثير من المشاكل التقنية 
في الاتصالء ولا تملك العديد من المناطق النائية اتصالات 1871-51 مناسبة بعدء وأيضًا تكون 
القضايا المتعلقة بمعالجة البيانات الضخمة مسؤولة عن التقدم البطيء في إنترنت الأشياء. 
وتحاول الشركات تقليل البيانات على مستوى جهاز الاستشعار بحيث يتم تمرير الحد الأدنى 
فقط من البيانات إلى السحابةء مما يجعل دعم البنية التحتية الحالية للكمية الضخمة من 
البيانات المتولدة من إنترنت الأشياء أمرًا شاقًا. وهناك مشكلة ذات صلة أخرى وهي تزويد 
الأجهزة بأجهزة استشعار لتكون قادرة على جمع ونقل البيانات للتحليلء ويستغرق الأمر 
في المتوسط من 18 إلى ١>‏ شهرًا لتبدأ إنترنت الأشياء بشحن منتجهاء ثم من سنة إلى سنتين 
إضافيتين لتوزيع وبيع منتجها في السوق. وبالإضافة إلى ذلك. سيس تغرق المستهلكون وقنًا 
لاستبدال الأشياء المتناظرة بمنتجات ذكية جديدة من إنترنت الأشياء. وكمثال. فإنه بالنسبة 
للناس يعد استبدال الهواتف الجوالة أسهل من استبدال السيارة وأدوات المطبخ والأقفال 
وأشياء أخرى يمكن أن تستفيد من وجود جهاز استشعار وبقائه متصلًا مع إنترنت الأشياء. 

Source: Cisco.com. (2015). Fog computing and the Internet of Things: Extend the Cloud to where the 


things are.  https://www.cisco.com/c/dam/en us/solutions/trends/iot/docs/computing-overview.pdf 
(accessed August 2016). 
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*- الأمان: يمثل أمن البيانات قضية عامة» ولكنها في سياق إنترنت الأشياء تعتبر قضية أكبر؛ إذ 
يصبح كل جهاز متصل ب إنترنت الأشياء نقطة دخول أخرى للقراصنة الأشرار للوصول إلى نظام 
كبيرء أو على الأقل تشغيل أو إتلاف الجهاز المحدد. فهناك قصص لقراصنة قادرين على الاختراق 
والتحكم في الوظائف الآلية للسيارة, أو السيطرة على فتح باب الجراج عن بعد. وتتطلب مثل 
هذه القضايا أن ينطوي أي اعتماد واسع النطاق لإنترنت الأشياء على اعتبارات أمنية منذ البداية. 
وعلى الرغم من هذه الاعتبارات الإدارية» إلا أن النمو الناشئ في إنترنت الأشياء وإمكانياته 
لمساعدتنا في تحقيق الرؤية للمدن الذكية وللشبكة الذكية ولأي شيء ذي يعد أمرًا محيرًا. فهي 
إحدى المجالات المفتوحة الشاسعة للإبداع وريادة الأعمال. i‏ 


أسئلة مراجعة على القسم 7-8: 
-١‏ ما هي استخدامات إنترنت الأشياء الأساسية؟ 
؟- ما هي مجموعات البناء التقنية في إنترنت الأشياء؟ 
$RFID (a la -Y‏ 
ع- إبحث على الإنترنت عن تطبیقات ۸۴1۲ في الرعاية الصحية والترفيه والرياضة. 
0- حدد بعض أهم العاملين في النظام البيئي لإنترنت الأشياءء واستكشف عروضهم. 
1- اذكر بعض القضايا الرئيسة التي ينبغي على المديرين إدراكها عند استكشاف إنترنت الأشياء؟ 
۸ الحوسبة السحابية وتحليلات الأعمال: 

يوجد اتجاه تقني حديث الظهور ينبغي على مس تخدمي تحليلات الأعمال الإلام به وهو 
الحوسبة السحابية. ويعرّف المعهد الوطني للمعايير والتقنية (۸181) الحوسبة السحابية على 
أنها: «نموذج لتمكين الوصول إلى الشبكة المناسبة عند الطلب إلى مجموعة مشتركة من موارد 
الحوسبة القابلة للتشكيل (كالشبكات والخوادم والتخزين والخدمات) والتي يمكن توفيرها 
وإصدارها بسرعة وبأقل جهد إداري أو تفاعل من مورد الخدمة» في حين تُعرّف ويكيبيديا (,.4.م 
Computing‏ 0udا)‏ الحوسبة السحابية تعريقًا فضفامًا وشاملًا وهو: ”أسلوب حوسبة يتم 
من خلاله توفير الموارد القابلة للتطوير بشكل ديناميكي وغالبًا ما تكون افتراضية ويتم توفيرها 
عبر الإنترنت» ولا يحتاج المستخدمون إلى معرفة أو خبرة في أو التحكم في البنى التحتية للتقنية 
في السحابة التي تدعمهم”. ومن ناحية أخرىء تعد الحوسبة السحابية اسمًا جديدًا للعديد 
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من الاتجاهات السابقة ذات الصلةء كحوسبة المرافق» وحوسبة شبكة مقدم خدمات التطبيق» 
والحوس بة عند الطلب» والبرمجيات كخدمة (848)ء وحتى الحوسبة المركزية القدهة باستخدام 
المحطات الصامتة. غير أن مصطلح الحوسبة السحابية ينتج أصلًا من إشارة إلى الإنترنت باعتباره 
«سحابة» ويمثل تطورًا في جميع اتجاهات الحوس بة المشتركة / المركزية السابقة. ويعرف القائم 
بالإدخال في ويكيبيديا أيضًَا أن الحوسبة السحابية هي مزيج من عدة مكونات لتقنية المعلومات 
كخدمات. فعلى سبيل المثال» تشير البنية الأساسية كخدمة (1885) إلى توفير منصات الحوسبة 
كخدمة (2235). بالإضافة إلى توفير منصة أساسيةء مثل إدارة الحكومة» والأمان, وما إلى ذلك 
وتتضمن أيضًا 5225 والتي تشتمل على تطبيقات يتم نقلها من خلال متصفح ويبء في حين تكون 
البيانات وبرامج التطبيقات موجودة على خادم آخر. 

بالرغم من Šole Lol‏ لا ننظر إلى البريد الإلكتروني على الويب كمثال للحوسبة السحابية» إلا أنه 
يمكن اعتباره تطبيقًا سحابيًا أساسيًا. وعادةٌ ما يقوم تطبيق البريد الإلكتروني بمستودعات البيانات 
(رسائل البريد الإلكتروني) والبرمجيات (برامج البريد الإلكتروني التي تسمح لنا بمعالجة وإدارة 
رسائل البريد الإلكتروني). ويوفر مزود البريد الإلكتروني أيضًا الأجهزة / البرامج والبنية الأساسية 
بالكامل. وطاما ظل الإنترنت متاحًاء يكون الوصول إلى تطبيق البريد الإلكتروني من أي مكان 
في السحابة ممكنًا. وعندما يتم تحديث التطبيق من قبل مزود البريد الإلكتروني as)‏ عندما 
يقوم 12811 بتحديث تطبيق البريد الإلكتروني الخاص به)ء فإنه يصبح متاخًا لجميع العملاء 
دون حاجتهم لتنزيل أي برامج جديدة. ومن أمثلة الحوسبة السحابية أيضًا مواقع الشبكات 
dido -LinkedIns Twitters Facebook Jis qo)! de Aelze Vt‏ يعتبر أي تطبيق عام 
على الويب مثالا على تطبيق سحاي. وهناك مثال آخر على تطبيق السحابة العامة وهو وثائق 
وجداول البيانات من »اع6008؛ حيث يسمح هذا التطبيق للمستخدم بإنشاء وثائق نصية أو 
جداول بيانات والتي يتم تخزينها Google pols—> dle‏ وتكون متاحة للمستخدمين من أي 
مكان يمكنهم الوصول إلى الإنترنت فيه. ومرةً أخرى» لا يحتاج المستخدم تثبيت أي برامج باسم 
«التطبيق في السحابة». كما أن مساحة التخزين موجودة أيضًا «في السحابة». 

وهناك مثال جيد على الأعمال العامة للحوسبة السحابية وهو خدمات الويب الخاصة بشركة 
ghi Amazon.com cub ¿a> ‘Amazon.com‏ بنية تحتية تقنية مذهلة لكل من التجارة 
الإلكترونية وذكاء الأعمال وإدارة علاقات العملاء وإدارة سلاسل التوريدء كما قامت بإنشاء مراكز 
بيانات رئيسة لإدارة عملياتها الخاصة. ومع ذلكء ومن خلال الخدمات السحابية في .810220 
com‏ يمكن للعديد من الشركات الأخرى استخدام نفس هذه التسهيلات للحصول على مزايا 
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هذه التقنيات دون القيام باستثمار مماثل. وكما هو الحال في خدمات الحوسبة السحابية 
الأخرى» يستطيع المستخدم أن يشترك في أي من التسهيلات على أساس: ادفع - كما - تذهب 
(Pay as you go)‏ ويعد هذا النموذج من السماح لشخص آخر بامتلاك الأجهزة والبرمجيات 
مع صنع استخدام التسهيلات على أساس الدفع - لكل - استخدامًا بمثابة حجر الزاوية في الحوسبة 
السحابية. ويوفر عدد من الشركات خدمات الحوسبة السحابية. مثل 1ممء.عع:59165]01 و(/181 
Googles (Microsoft Azure)s (Bluemix‏ 253 

وكما هو الحال في العديد من اتجاهات تقنية المعلومات الأخرى» فقد أنتجت الحوسبة 
السحابية عروضًا جديدةً في ذكاء الأعمال؛ حيث تسمح هذه الخيارات للمنظمة بتطوير مستودع 
بياناتها والدفع فقط نظير ما تستخدمه بالفعل. وقد يستخدم ال مستخدم النهائي لخدمة ذكاء 
الأعمال القائمة على السحابة منظمة واحدة لتطبيقات التحليل والتي تستخدم في المقابل شركة 
أخرى للمنصة أو للبنية التحتية. وتلخص المقاطع المتعددة التالية أحدث الاتجاهات في واجهة 
الحوسبة السحابية وذكاء الأعمال / تحليلات الأعمال )2013 .(Demirkan & Delen,‏ 

ويوضح الشكل )٤-۸(‏ بنية مفاهيمية لبيئة دعم القرار الموجهة بالخدماتء والتي تعتبر نظام 
تحليلات قائم على السحابة. وفي هذا الشكل يتم دمج الخدمات القائمة على السحابة مع بنية 
التحليلات العامة المقدمة في الفصول السابقة. 

إدارة العمليات إدئرة المملوماث 





إدارة البيانات 


















































Sources: Based on Demirkan,H.,& Delen,D (April, 2013)Ievergingcapabilitiesof-orienteddecision 
support systtems: putting analytics and big data in cloud. decision support Systtems.55(1).412-421. 


شكل :٤-۸‏ بنية مفاهيمية لنظام دعم ylw‏ 
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وفي حلول دعم القرار الموجهة بالخدمات. يمكن الحصول على العناصر التالية ds‏ على حدة 
أو مجتمعة وتقدهها للمستخدمين كخدمةء وهذه العناصر هي: 


-١‏ أنظمة التشغيل. 
-'١‏ مستودعات البيانات. 
"- المعالجة التحليلية الفورية. 
ع- مكونات المستخدم النهائي. 

ويمكن الحصول على إحدى أو كل هذه الخدمات من خلال السحابة. ولأن مجال الحوسبة 
السحابية يتطور سريعًا وينمو بإيقاع متسارع» فقد نتج عن ذلك التباس كبير في المصطلحات 
المستخدمة من جانب مختلف الموردين والمستخدمينء فتختلف المسميات من حيث البنية الأساسية 
والمنصة والبرمجيات والبيانات والمعلومات والتحليلات كخدمة. ونعرّف فيما يلي هذه الخدمات» 
ثم نلخص ال منصات التقنية الحائية ونسلط الضوء على تطبيقات لكل منها من خلال حالات عملية. 
البيانات كخدمة :(DaaS)‏ 

يدافع مفهوم البيانات كخدمة بشكل أساسي عن وجهة النظر التي تقول: «أين تعيش 
البيانات» حيث لا تهتم المنصة الفعلية بمكان إقامة البيانات. فقد تتواجد البيانات في جهاز 
حاسب محلي أو في خادم في مزرعة خوادم داخل بيئة الحوسبة السحابية. ومع 2225, يمكن لأي 
عملية أعمال الوصول إلى البيانات أينما وجدت. بدأت البيانات كخدمة بفكرة أن جودة البيانات 
تحدث في مكان مركزيء وتطهير وإثراء البيانات وعرضها على أنظمة أو تطبيقات أو مستخدمين 
مختلفين» بغض النظر عن مكان وجود تلك البيانات سواء في ا منظمة» أو على أجهزة الحاسب» 
أو على الشبكة. والآنء تم استبدال هذا بإدارة البيانات الأساسية وحلول تكامل بيانات العملاء 
حيث هكن أن تتواجد سجلات العملاء (أو المنتجات» أو الأصولء إلخ) في أي مكان» وتكون متاحة 
كخدمة لأي تطبيق به خدمات تسمح بالوصول إليها. ومن خلال تطبيق مجموعة قياسية من 
التحويلات على المصادر المتنوعة للبيانات (كأن يتم التأكد من أن الحقول الخاصة بالجنس والتي 
تحتوي على أنماط رمزية مختلفة [مثلء o5 [M/F Mr/Ms‏ ترجمتها جميعًا إلى ذكر / أنثى) ثم 
تمكين التطبيقات من الوصول إلى البيانات عبر واجهات مفتوحة مثل .501 وXQuery XMLo‏ 
بحيث يكن لطالبي الخدمات الوصول إلى البيانات دون الحاجة إلى المورد أو النظام. 
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وباستخدام 1285: يستطيع العملاء الانتقال بسرعة وذلك لسهولة الوصول إلى البيانات وحقيقة 
أنهم ليسو بحاجة إلى معرفة شاملة بالبيانات الأساسية. فإذا طلب العملاء بنية بيانات مختلفة إلى 
حد ما أو متطلبات خاصة بالموقع» تكون الاستجابة لهم سهلة لأن التغييرات تكون عند أدنى حد لها 
(رشيقة). ثانيّه يستطيع مقدمو الخدمة بناء القاعدة بالاستعانة بخبراء البيانات ومصادر خارجية 
لطبقات التحليل أو التقديم (والتي تتيح للمستخدم واجهات فعالة جدًا من حيث التكلفة كما 
تجعل طلبات التغيير في طبقة التقديم أكثر جدوى) ويتم التحكم في الوصول إلى البيانات من خلال 
خدمات البيانات» ويتجه إلى تحسين جودة البيانات لأن هناك نقطة واحدة للتحديثات. 
البرمجيات كخدمة (5285): 

يتيح هذا النموذج للمستهلكين استخدام التطبيقات والبرامج التي يتم تشغيلها على أجهزة 
الحاسب البعيدة في البنية التحتية للسحابة. ولا يحتاج المستهلكون أن يهتموا بإدارة البنية 
التحتية للسحابة؛ فيجب عليهم الدفع مقابل استخدام البرمجيات فقط. وكل ما نحتاج إليه هو 
متصفح ويب للاتصال بالسحابة. وتقدّر شركة جارتنر أن إيرادات 5385 في عام ۲۰۱۰ حوالي YY‏ 
مليار دولار أمريي وتستخدم في 2۷۷ من جمیع المنظمات. Picasag Gmail ġe JS gg‏ 9 
Flickr‏ أمثلة على 5085. 
المنصة :(PaaS) douss‏ 

وباستخدام هذا النموذجء تستطيع الشركات نشر البرمجيات والتطبيقات الخاصة بها في السحابة 
بحيث يمكن استخدامها من قبل العملاء. ولا يتعين على الشركات إدارة الموارد المطلوبة لإدارة 
تطبيقاتها في شبكات تشبه السحابة أو الخوادم أو التخزين أو أنظمة التشغيلء وهذا يقلل من تكلفة 
صيانة البنية التحتية الأماسية لتشغيل برامجهم كما يوفر أيضًا وقت إعداد هذه البنية التحتية. 
والآن» يستطيع المستخدمون التركيز فقط على أعمالهم دون التركيز على إدارة البنية التحتية لتشغيل 
برامجهم. ومن الأمثلة على -Google App Engines Amazon EC25 Microsoft Azure :PaaS‏ 
البنية التحتية كخدمة (1225): 

في هذا النموذج» يتم توفير موارد البنية التحتية كالشبكات والتخزين والخوادم وموارد 
الحوسبة الأخرى لشركات العملاء؛ إذ يستطيع العملاء تشغيل تطبيقاتهم والحصول على حقوق 
إدارية لاستخدام هذه الموارد ولكنهم لا يديرون البنية التحتية الأساسية. ويجب على العملاء 
الدفع مقابل استخدام البنية التحتية. وخير مثال على ذلك هو خدمات الويب $ Amazon.‏ 
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1. فقد طورت Sly gah esl) ånni dzos us Amazon.com‏ بيانات. بحيث هكن 
للشركات الأخرى استخدام خدمات السحابة التابعة ل ۸۵20١.٥٣‏ بنظام الدفع - لكل - 
استخدام دون الحاجة إلى عمل استثمارات مماثلة. 

يجب أن نلاحظ أن هناك الكثير من الالتباس والتداخل في استخدام مصطلح السحابة. فعلى 
سبيل Asàs JEL‏ بعض اموردين أيضًا امعلومات كخدمة (TaaS)‏ والتي تعد امتدادًا ل -DaaS‏ 
ومن الواضح أن 1225 تختلف عن «البنية التحتية كخدمة» التي تم شرحها منذ قليل. ويكون هدفنا 
هنا هو التعرف فقط على وجود درجات متفاوتة من الخدمات التي يمكن لأي منظمة الاشتراك فيها 
لإدارة تطبيقات التحليلات. ويس لط الشكل (0-8) الضوء على مستوى الاشتراكات في الخدمة التي 
يستخدمها العميل في كل نوع من الثلاثة للعروض السحابية الرئيسة. ويتضح من الشكل أن SaaS‏ 
تأتي في المستوى الأعلى من الخدمة السحابية التي قد يحصل عليها العميل. فمثلا عند استخدام 
5 01566 تستخدم إحدى المنظمات البرمجيات كخدمة: ويكون العميل هو ال مسؤول الوحيد عن 
إحضار البيانات» وتقع العديد من التحليلات كتطبيق خدمة في هذه الفئة أيضًا. 





تدار بواسطة العميل 
] [ 


تدار بواسطة مورد السحابة 
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البرمجيات كخدمة المنصة كخدمة البنية التحتية كخدمة 
IaaS PaaS SaaS‏ 











شكل 0-۸: حزمة التقنية كخدمة لأنواع مختلفة من عروض السحابة 
التقنيات الأساسية للحوسبة السحابية: 


الافتراضية: وهي إنشاء نسخة افتراضية لشيء يشبه نظام التشغيل أو الخادم. ومن الأمثلة 
البسيطة على الافتراضية هو التقسيم المنطقي لمشغل الأقراص الصلبة لإنشاء مشغلين منفصلين 
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للأقراص الصلبة في الحاسب. ويمكن للافتراضية أن توجد في جميع المجالات الثلاثة للحوسبة كما يلي: 

- افتراضية الشبكة: أي تقسيم السعة التنزيلية المتاحة إلى قنوات» وهذا يعمل على إخفاء تعقيد 
الشبكة بتقسيمها إلى أجزاء يمكن إدارتهاء ثم بعد ذلك يمكن تخصيص كل سعة تحميلية لخادم 
أو جهاز معين بشكل فوري. 

- افتراضية التخزين: هو تجميع التخزين المادي من أجهزة تخزين شبكة متعددة إلى جهاز 
تخزين واحد يمكن إدارته من وحدة التحكم ال مركزية. 

- افتراضية الخادم: وهو إخفاء الخوادم المادية عن مستخدمي الخادم, ولا يتعين على المستخدمين 
إدارة الخوادم الفعلية أو فهم التفاصيل المعقدة لموارد الخادم. 

ويرتبط هذا الاختلاف في مستوى الافتراضية مباشرةً مع الخدمة السحابية المستخدمة. 


نماذج نشر السحابة: 


يمكن الحصول على الخدمات السحابية بعدة طرق من بناء بنية تحتية خاصة بالكامل إلى 

المشاركة مع الآخرين. وتعد النماذج الثلاثة التالية هي الأكثر شيوعًا: 

- سحابة خاصة: ويطلق عليها أيضًا سحابة داخلية أو سحابة الشركات» وهي صورة للخدمة 
السحابية أكثر أمانًا من السحب العامة مثل عتتناتة 115 وتإرعنا0ع81 «Google‏ ويتم تشغيلها 
فقط ممؤسسة واحدة ذات عبء عمل المهام الحاسمة والمخاوف الأمنيةء وهي توفر نفس 
الفوائد كخدمة عامة شبيهة بالسحابة, والقابلية للتغيير. وتغيير موارد الحوسبة حسب الطلبء 
وما إلى ذلك. وتتمتع الشركات التي لديها سحابة خاصة بالتحكم المباشر على بياناتها وتطبيقاتها. 
وتكمن عيوب امتلاك سحابة خاصة في تكلفة صيانة وإدارة السحابة حيث يكون طاقم عمل 
تقنية المعلومات في الشركة هو المسؤول عن إدارتها. 

- سحابة عامة: وفي هذا النموذج» يستخدم المشترك الموارد المعروضة من جانب مقدمي الخدمة على 
الإنترنت» وتتم إدارة البنية التحتية للسحابة بواسطة مقدم الخدمة. وتنمثل الليزة الأساسية لنموذج 
السحابة العامة هذا في توفير وقت وتكلفة إعداد الأجهزة والبرامج المطلوبة لتنفيذ الأعمال. ومن 
أمثلة السحابة العامة منصة -Amazon AWSs Google App Engines Microsoft Azure‏ 

- سحابة مختلطة: تمنح السحابة المختلطة الأعمال مرونة كبيرة بنقل أعباء العمل بين السحب 
الخاصة والعامة. فعلى سبيل المثالء تستطيع أي شركة أن تستخدم التخزين السحاي المختلط 
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لتخزين بيانات المبيعات والتسويق الخاصة بهاء ومن ثم استخدام منصة سحابة عامة مثل 
Amazon Redshif‏ لتنفيذ الاستعلامات التحليلية لتحليل بياناتها. ويعد المطلب الرئيس هو 
الاتصال الشبكي وتوافق 421 (واجهة برمجة التطبيقات) بين السحابتين الخاصة والعامة. 
كبار موردي منصة السحابة في التحليلات: 
نحدد في هذا القسم أولًا بعض المشغلين الأساسيين للسحابة التي توفر البنية الأساسية 
للتحليلات dadas‏ بالإضافة إلى وظائف التحليلات المختارة. ثم نذكر أيضًا عروض التحليلات - 
كخدمة التمثيلية التي قد تعمل حتى على منصات السحابة هذه. 
Elastic Beanstalk‏ 1 وهي خدمة مقدمة من خدمات q"5 -Amazon c5‏ 
تستطيع نشر وإدارة وتطوير تطبيقات الويب وتدعم لغات البرمجة التالية: 398[ وتإطنا1 و 
-HS9 Apache Tomcats Apache HTTP Ja polg> s NET PHPg Python‏ 293« 
على المستخدم تنزيل رمز التطبيق. ويقوم 262252112 112512 بنشر التطبيقء» وموازنة العبى 
والقياس التلقاني» ومراقبة صحة التطبيق. ولذا؛ يستطيع ا مستخدم التركيز على بناء مواقع الويب» 
وتطبيقات الجوالء وخلفية 421 وأنظمة إدارة المحتوى» «SaaS‏ وما إلى ذلك في حين »,35 Elastic‏ 
11أوضةء5 على التطبيقات والبنية التحتية لإدارتها. كما يمكن للمستخدم استخدام خدمات ويب 
6 أو بيئة تطوير متكاملة مثل 0o): Visual Studio gf Eclipse‏ تطبيقهم. ويجب أيضًا 
على المستخدم دفع تكاليف موارد ۸۷8 اللازمة لتخزين وتنفيذ التطبيقات. 
iaio gag :IBM Bluemix‏ سحابة تتيح للمستخدم إنشاء تطبيقات باستخدام عدة تقنيات 
مجانية على الحاسبء كما يكن المستخدمين من نشر وإدارة التطبيقات المختلطة باستخدام 
البرنامج. IBM Watson gas‏ والتي تتوفر خدماتها على 2<ذاه13106 181/1 يستطيع المستخدمون 
الآن إنشاء تطبيقات إدراكية للجيل القادم والتي تستطيع الاكتشاف والابتكار, واتخاذ القرارات. 
كما يمكن استخدام خدمات 1178508 /181 لتحليل العواطف وتحويل النص إلى كلام مسموع 
بصوت طبيعي. حيث يستخدم 10721502 مفهوم الحوس بة الإدراكية لتحليل النصوص ومقاطع 
الفيديو والصورء وهو يدعم لغات Python; Ruby; PHPs Gos Java Ja ázxa;JI‏ 
do lous danza sob (Microsoft) 3945 Sh Cl : Microsoft Azure‏ تسمى Azure‏ 
لتقوم بإنشاء ونشر وإدارة التطبيقات والخدمات من خلال شبكة مراكز بيانات مايكروسوفت 
(Microsoft)‏ وهي تعمل على شكل كل من 2385 و1435 وتقدم العديد من الحلول كالتحليلات 
ومستودعات البيانات والمراقبة عن بُعد والصيانة التنبؤية. 
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gag :"Google App Engine‏ منصة حوسبة سحابية من خدمات Google‏ تُستخدم لتطوير واستضافة 
التطبيقات» وهي JS‏ من خلال مراكز بيانات Python aj cJ à oll Udo es 5 Google‏ 
PHP Rubys Javas‏ وتوفر بيئة 8180106137 خدمات مستودع البيانات من خلال السحابة. 

:OpenShift‏ وهوعبارة عن منصة تطبيقات سحابية تابعة ل غ118 164 قانئمة على موذج 
5. ومن خلال هذا النموذج» يتمكن مطورو التطبيقات من نشر تطبيقاتهم على السحابة. 
ويتوفر نموذجان مختلفان ل 5114م6م0. يعمل أحدهما بمثابة 2225 العامة والآخر بمثابة 
5 الخاص. إن عصنتله0 النطكمءم0© هونظام 2225 العام في غ513 160 والذي يعرض تطوير 
وبناء واستضافة ونشر التطبيقات في السحابة. ويسمح -OpenShift Enterprise «2l5J] PaaS‏ 
بتطوير وبناء ونشر التطبيقات على خادم داخلي أو منصة سحابية خاصة. 


التحليلات كخدمة :(AaaS)‏ 


تعتبر التحليلات والحلول الإدارية القائمة على البيانات بمثابة التطبيقات التي تستعلم عن 
البيانات لاستخدامها في تخطيط الأعمال. وحل المشكلات. ودعم القرارء وهي تتطور بسرعة 
وتُستخدم تقريبًا من جانب جميع المنظمات. ويتم إغراق المؤسسات باب معلومات» ويُثل الحصول 
على أفكار من هذه البيانات تحديًا كبير لها. وبالإضافة لذلك. توجد تحديات تتعلق بأمن 
وجودة البيانات والالتزام. ويعتبر 4225 منصة تحليلية قابلة للتوسع باستخدام نموذج التوصيل 
القائم على السحابة. حيث تقوم أدوات تحليل بيانات ذكاء الأعمال والبيانات المختلفة بمساعدة 
الشركات في صنع القرار بشكل أفضل والحصول على أفكار من بياناتها الضخمة. وتغطي المنصة 
جميع النواحي الوظيفية ابتداءً من جمع البيانات من الأجهزة المادية وانتهاءً بتصوير البيانات. 
ويوفر 4885 للشركات نموذجًا ذكيًا لإعداد التقارير والتحليلات مما يمكنهم من التركيز على ما 
يفعلون بأفضل ما يمكن. كما يمكن للعملاء تنفيذ تطبيقاتهم التحليلية الخاصة في السحابة أو 
وضع بياناتهم على السحابة واستقبال أفكار مفيدة. 

وتضم 4285 جوانب الحوسبة السحابية إلى تحليلات البيانات الضخمة؛ ومَكّن علماء البيانات 
والمحللين من خلال السماح لهم بالوصول إلى مجموعات بيانات المعلومات التي تتم إدارتها بشكل 
مركزي. ويمكنهم الآن استكشاف مجموعات بيانات المعلومات بصورة تفاعلية أكثر واكتشاف 
الأفكار الأكثر ثراءً بشكل أسرع. وبالتالي تجنب العديد من التأخيرات التي قد يواجهونها أثناء 
اكتشاف اتجاهات البيانات. فمثلًاء قد يوفر المورد الوصول إلى منصة تحليلية عن بُعد في مقابل 
دفع رسوم» ويتيح ذلك للعميل استخدام برامج التحليلات كلما لزم الأمر. ويعتبر 4285 جزءًا من 
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5 و2385 و1445 وبالتالي يساعد تقنية المعلومات بشكل معنوي على تقليل كل من التكاليف 
وخطر الالتزامء في حين يرفع من إنتاجية ا مستخدمين. 

على سبيل المثال» يصل موظف و J] eBay‏ شريحة افتراضية لخادم مستودع البيانات الرئيس 
بحيث هكنهم تخزين وتحليل مجموعات البيانات الخاصة بهم. وقد حققت أسواق بيانات تردقاء 
الافتراضية الخاصة نجاحًا كبيرًا فيما يتراوح من 00 إلى ٠٠١‏ عملية في وقت واحد. وقد ألغت أسواق 
البيانات الافتراضية احتياج الشركة إلى أسواق بيانات مادية جديدة, والتي تقدر تكلفتها مليون 
دولار لكل منها وتتطلب اهتمامًا طوال الوقت من عدة موظفين ذوي مهارات (2008 (Winter,‏ 

gu‏ 4235 في السحابة وفورات الحجم والمدى من خلال توفير العديد من التطبيقات 
التحليلية الافتراضية مع مزيد من القابلية للتطوير وتوفير التكلفة. ومع تزايد أحجام البيانات 
وعشرات من التطبيقات التحليلية الافتراضيةء تكون هناك فرص بأن الكثير منها يستفيد بالمعالجة 
في أوقات مختلفة, وأنماط الاستخدام, والتكرارات (2011 ب4امكلهله1). 

يعتبر التنقيب في كل من البيانات والنصوص تطبيقًا آخر واعدًا جدًّا من 4285. يمكن أيضًّا استخدام 
الإمكانيات التي يجلبها توجيه الخدمة (بجانب الحوسبة السحابية والموارد المجمّعة والمعالجة المتوازية) 
إلى عام التحليلات من أجل التحسين واسع النطاقء ومشاكل القرارات متعددة المعايير المعقدة جدًاء 
ونماذج المحاكاة الموزعة» ثم نحدد بعد ذلك عروض التحليلات المنتقاة والقائمة على السحابة. 
التحليلات الممثلة كعروض خدمة: 

تحليلات :45111 كخدمة: تعتبر 45161 167:20218' هي المحرك الرئيس في تقديم التحليلات 
كخدمة. وتشتمل 45]67 على كل من Aster MapReduce Analytics Foundation‏ )£43 
بمعالجة البيانات عبر مجموعات هائلة من البيانات)» ووعتاتإلهصىة حامة© رعادة مع كثير من 
أدوات ذكاء الأعمال الأخرى. Aster AaaS gog‏ تستطيع الشركات الحصول على أفكار قيّمة من 
بياناتهاء مما يساعدها في اتخاذ قرارات أفضلء دون عمل أي استثمار صريح في البنية التحتية. 

65 18415017 1834: توفر 1834 جميع عروض التحليلات من خلال خدمة 
السحابة uala ehxo gou IBM Watson Analytics pä; Cus tl dol5J! Bluemix‏ 
وإمكانيات التحليلات التي يمكن بناؤها ونشرها من خلال «تدمعناا8. بالإضافة إلى ذلك قدم 
G5 C Ll L$,e IBM Watson Cognitive‏ على السحابة يستخدم التنقيب في النص والتعلم 
العميق بمستوى sdg Jiz Jle‏ عرضنا لذلك من قبل في سياق الحديث عن التنقيب في النص. 
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111101 يعد التنقيب في النص واحدًا من المجالات النامية في عام 
التحليلات. يعمل التنقيب à‏ النص على تحديد موضوعات الوثائق ذات المستوى العالي» واستنتاج 
المشاعر من الاستعراضات» وتصوير الوثيقة أو علاقات ا مصطلح / المفهوم. وقد تم شرح ذلك 
بالتفصيل في فصل التنقيب في النص. وتقدم «12م6.)<ع2/10268/71 هذه الإمكانيات في السحابة 
من خلال موقع الويب الخاص بهم. 

تحليلات وإحصاءات 545 المرئية: يوفر معهد 545 برمجيات التحليلات الخاصة به عند 
الطلب من خلال السحابة. وحاليًاء تتوفر إحصاءات 5845 المرئية فقط كخدمة سحابة وتكون 
„Tableau J usla‏ 

o5 dg Shl goby! eal aof gog :TABLEAU‏ تقدمه في سياق الحديث عن التحليلات 
الوصفيةء ويتوفر أيمًا من خلال السحابة. 

15آ52101171: وهو أحد حلول مستودعات البيانات القائمة على السحابة؛ حيث يستطيع 
المستخدمون جمع بياناتهم من مصادر متعددة كمصدر واحد وتحليلها باستخدام ©500101181. 

:PREDIX BY GENERAL ELECTRIC‏ کما ذکرت التقاریرء أن جارال إلکتریك ترکز 
على تطوير منصة إنترنت الأشياء للتحليلات التنبؤية لمساعدة عملائها في الوصول إلى تشغيل 
وإدارة المعدات والمنصات الصناعية بشكل أفضل. وقد طورت الشركة عرضًا تحليليًا جديدًا 
يطلق عليه Predix‏ (وقد تمت مناقشته في حالة عملية ۳-۸)» وهو متوفر عبر السحابة من خلال 
Amazon Web Services eolsas-‏ وسيتوفر قريبًا „Microsoft Azure JiS g‏ 

تطبيقات تحليلات توضيحية باستخدام البنية التحتية للسحابة: 
في هذا القسم» نسلط الضوء على عدة تطبيقات تحليلات سحابيةء وسنعرضهم كقسم واحد 
في مقابل حالات عملية منفردة. 
مركز 4201508 (211 للسرطان يستخدم إمكانيات الحوسبة الإدراكية لشركة 
BM Watson‏ نح مرضى السرطان علاجًا أفضل: 
Texas MD Anderson à sle- 55a 52s)‏ للسرطان (والذي يطلق عليه مركز 
3 للسرطان) واحدًا من أفضل مستشفيات السرطان في الولايات المتحدة. 
فمنذ عام ۱۹٤۱‏ عالج مركز MD Anderson‏ للسرطان ٠٠١‏ ألف مريض بالسرطان 
ولديه Jis‏ 19 ألف موظف. 
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حيث يتم في كل عام علاج حوالي ٠٠١‏ ألف مریض بالسرطان فی MD Anderson‏ 
ومحيطه المحلي والقومي. ونتيجة لذلك؛ تراكم لدى المركز الكثير من البيانات الإكلينيكية 
للأورام تخص مرضى المركز. وتشمل البيانات الرعاية المقدمة للمرضىء والتجارب 
الإكلينيكية» ونتائج اختبارات المرضىء ويتم ذلك بشكل يوميء سواء في ملاحظات الباحثين 
والأطباء أو الموجودة في قواعد البيانات عن بُعد وملفات الأطباء الآخرين الذين عالجوا 
هؤلاء ا مرضى في الماضي. وقد أدرك مسؤولو ۸١4٠۴0١‏ 2 أنه إذا تم جمع وتحليل 
كل هذه المجموعة من البيانات الضخمة في مصدر واحد وتحليلها. فسوف يساعد ذلك 
الأطباء في التجارب الإكلينيكية ومن ثَّمْ تحديد أفضل اختيارات لعلاج مرضاهم. 


“Moon Shots” glyw lij MD Anderson أصدر مسؤولو‎ 01 ele às 
على علاجات أفضل للسرطان. كما‎ sgi IBM Watson ggib Odos chyab وقاموا‎ 
قاموا بتطوير منصة تقنية تسمى ©11آ:8501 تجمع كل البيانات المتفرقة غير المهيكلة‎ 
IBM JS Èo (EMR) للمرضى في نظام واحد للسجلات الطبية الإلكترونية‎ 
ويستخدم تحليلات ا لمحتوى لإنشاء ملف تعريف‎ E۷۸ بسلاسة مع نظام‎ Watson 
شامل لكل مريض بالسرطان في شكل مهيكل للأطباء. فهي تساعد الأطباء على التشخيص‎ 
الأفضل لحالة ا مريض ومُكّنهم من إجراء مقارنة بين المرضى استنادًا إلى مجموعة جديدة‎ 
MD Anderson Syo skbl من السمات المعتمدة على البيانات. والآنء يستطيع فريق‎ 
مجموعة من ا مرضى لتحديد أولئك الذين يستجيبون بشكل مختلف للعلاجات‎ diis 
واكتشاف السمات ال مسؤولة عن هذه الاختلافات. كما يمكن للأطباء الآن عرض المرضى‎ 
على المشاركة في التجارب الإكلينيكية على العلاجات الجديدة بناءً على الدليل والخبرة.‎ 
Sources: MDanderson.org. (2013). MD Anderson taps IBM Watson to power 
“Moon Shots?” mission. https//www.mdanderson.org/newsroom/201310//md- 
anderson-ibm-watson-work-togetherto-fight-cancerhtml ^ (accessed August 
2016); IBM.com (2015). Smarter care at MD Anderson. http://www-03.ibm.com/ 
software/businesscasestudies/us/en/corp?synkey-H447240O66679238 ^ (accessed 
August 2016); YouTube.com. (2014). Smarter care at MD Anderson. https://www. 
youtube.com/watch?v-savJ8VQOkcA (accessed August 2016). Wikipedia.org. (n.d.). 


University of Texas MD Anderson Cancer Center. https;//en.wikipedia.org/wiki/ 
University of Texas MD Anderson Cancer Center (accessed August 2016). 
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مدارس التعليم العام فيتاكوماء واشنطون Microsoft Azure Machine Learning e42x5‏ 
$a‏ بالتسربات من التعليم: 

تعتبر مدارس تاكوما العامة هي الإدارة التعليمية الرئيسة في تاكوماء واشنطن. 
وتتكون من 0 مدرسة ابتدائية و5 مدارس متوسطة و5 مدارس ثانوية. وهي تعتبر ثالث 
أكبر إدارة تعليمية في ولاية واشنطن, بأكثر من "٠٠٠١‏ طالب وأكثر من 0٠٠١‏ موظف. 


وقد أشارت دراسة أجریت ف عام ۲۰۰۷ إلى خمس مدارس ثانوية من مدارس تاكوما 
العامة على أنها ”مصانع للتسرب". وبحلول عام ١٠١‏ كان الموقف في غاية السوء. فقد 
حصل فقط 00 من طلاب المدارس الثانوية على شهادة الدبلوم الخاصة بهم في الوقت 
المحددء وهومعدل أقل بكثير من المعدل الوطني البالغ ۸۸. كان لدى الإدارة التعليمية 
الكثير من البيانات الخاصة بالطلاب كدرجات الاختبارء وأماكن الإقامةء ومدارسهم 
الابتدائية والمتوسطة التي أتوا منها. فأرادوا باستخدام هذه البيانات أن يوجدوا حلا لرفع 
معدلات التخرج. كما أرادوا أيضَّا التنبؤ المسبق بالطلاب الذين من المحتمل تسربهم 
من التعليم» وذلك منحهم اهتمامًا خاصًا مشاكل الطفل ومن َم اتخاذ إجراءات وقائية. 

شرعت مدارس تاكوما العامة في استكشاف حلول متنوعة لذكاء الأعمال من 
أجل تحليل بياناتها. وتعاونت خدمات استشارات مايكروسوفت (8/1160501) مع 
ا لمنطقة التعليمية وقامت بإنشاء مستودع بيانات يلتقط معلومات تخص الطالب 
كالصحة والدرجات ونسبة الحضور وتفاصيل إضافية مستقاة من أنظمة معلومات 
طلاب المدرسة. كما ساعدت خدمات الإكسيل التابعة لمايكروسوفت (Microsoft)‏ 
وأهذه62 ه50 المدرسين في مراجعة البيانات التاريخية لطلابهم والإجراءات التي تم 
اتخاذها على المقاييس المشاهدة. وقد ساعدهم ذلك على قياس تقدم الأطفال مجتمعين 
وتحديد مقدار جودة أداء المدرسة في مساعدة الأطفال على التقدم للأمام. 

ثانياء أرادت الإدارة التعليمية التنبؤ بالطلاب المحتمل تسربهم من التعليم» حتى 
يتمكنوا من مساعدتهم بشكل مسبق والعمل معهم عن قرب. ومرةً أخرى. تعاون 
مسؤولو الإدارة مع شركة مايكروس وفت (3120501) لإنشاء نموذج بيانات يبرهن 
«Microsoft's Azure Machine Learning (ML) (Je 4: 255 esgall‏ وهو حل 
تحليلي تنبؤي يستند إلى المنصة السحابية التابعة لمايكروسوفت (Microsoft)‏ وقد 
قام هذ! النموذج بتحليل البيانات التي تم رفعها إلى ©4211 من أنظمة معلومات 
متعددة على مباني الحرم الجامعي. وقام مصنع بيانات 42116 بتمكين خط أنابيب 
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تنبؤي يستخدم نموذج Baz Azure ML‏ بتعرض الطالب لخطر التسرب. ويتم وضع 
النتائج التنبؤية من خلال قاعدة بيانات .501 421016 211105016 بحيث يتمكن 
أعضاء طاقم العمل وأعضاء مجلس الإدارة التعليمية من مراجعة النتائج باستخدام 
لوحات معلومات 81 20167. وهكذا تمكنت الإدارة من رفع معدلات التخرج لمدارس 
تاكوما العامة من 200 في عام ۲١٠١‏ إلى ۸۲,١‏ في عام ٠١15‏ وذلك بمساعدة التحليلات 
التنبؤية -Microsoft Azure Machine Learning‏ 
Sources:Blogs.technet.microsoft.com (2015). MLpredictsschool dropout risk &boosts‏ 
graduation rates. https://blogs.technet.microsoft.com/machinelearning/201504/06//‏ 
ml-predicts- school-dropout-risk-boosts-graduation-rates/(accessed August 2016);‏ 
Customer.microsoft.com (2015). Tacoma Public Schools: Predicting student dropout‏ 
risks, increasing graduation rates with cloud analytics. https://customers.microsoft.‏ 
com/Pages/CustomerStory.aspx?recid-20703 (accessed August 2016); YouTube.com‏ 
The saving power of data. https://www.youtube.com/watch? v-rfAoKs8XxzY‏ .)2016( 
(accessed August 2016).‏ 


مركز cock‏ Hitch-artmouthط‏ الطبي يقدم الرعاية الصحية المسبقة الشخصية 
ڊamlخlم :Microsoft Cortana Analytics Suite‏ 

يق ع مركز hartmouth-Hitchcock‏ الطبي «SUA $ (DHMO)‏ نيوهامبشاير. 
وهو المركز الطبي الأكادمي الوحيد في نيوهامبشاير وبه ما يقرب من 20١‏ سرير. 
ويسعى هذا المركز أن تحدد بشكل مسبق صحة الأفراد المحتمل إصابتهم بالأمراض 
وبالتالي وقايتهم قبل الوقوع في فخ المرض. ويتمثل هدفهم في توفير الرعاية الصحية 
الشخصية بتكلفة أقل. فتق وم الممرضات والمدربون الصحيون بتتبع الحالة الصحية 
للمريض أولًا بأول» ويتم جمع البيانات باستخدام أجهزة استشعار مرفقة بأجهزة ضغط 
الدم وأجهزة قياس النبض وأجهزة Microsoft Band Jis Obli g5‏ ويتم نقل 
هذه البيانات إلى سحابة ٠٣ا۸2‏ باستخدام الهواتف ASII‏ ثم يتم عرض البيانات 
على لوحات المعلومات التي تتم مراقبتها بشكل مستمر ۲٤‏ ساعة في اليوم سبعة أيام 
à‏ الأسبوع بواسطة الممرضات المسجلات ڊwlتخlم Microsoft Cortana Analytics‏ 
Suite‏ وعندما تتخطى بيانات المريض حد السلامة» يتم تنبيه الممرضات. الاق يقمن 
فورًا بالتواصل مع المريض» وبالتالي يتم تجنب المريض لخطر أي مشكلة خطيرة. وكنتيجة 
لاستخدام تقنية مايكروسوفت oda (Microsoft)‏ هكن مراقبة صحة المريض عن بعد 
من منزل المريضء مما يساعد على تقليل تكلفة الزيارات المنتظمة للأطباء. 
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Sources: Blogs.microsoft.com (2015). Dartmouth-Hitchcock ushers in a new age 
of proactive, personalized healthcare using Cortana Analytics Suite. http://blogs. 
microsoft.com/transform/201513/07//dartmouth-hitchcock-ushers-in-a-new- age- 
of-proactive-personalized-healthcare-using-cortana-ana- lytics-suite/(accessed 
August 2016); Enterprise.microsoft.com. (2015). How Dartmouth-Hitchcock is 
challenging healthcares status quo with Cortana Analytics. https;//enterprise. 
microsoft. com/en-us/industries/health/how-dartmouth-hitchcock-is-chal- lenging- 
healthcares-status-quo-with-cortana-analytics/(accessed August 2016); YouTube. 
com. (2015). Dartmouth-Hitchcock revolutionizes the U.S. healthcare system. 
https://www.youtube.com/watch?v—-wVeHZNn8aU (accessed August 2016). 


Mankind Pharma‏ تستخدم بنية السحابة التحتية 181۷ لتقليص وقت تنفيذ 
التطبيق بنسبة AAA‏ 

تعتبر Mankind Pharma‏ 5,5 1 أدوية مقرها في نيودلهيء الهند. هي رابع أكبر منتج 
للوصفات الطبية المخدرة في الهند حيث يعمل بها ١١‏ ألف موظف وتبلغ إيراداتها ٠٠١‏ مليون 
دولار. ومع أعمالها ا متناميةء كانت 222118 1131:1530 تبحث عن بيئة استضافة سحابية 
لتوفير بنية تحتية ممنصة الموارد البشرية olal (HR)‏ بها وللمهمات الحساسة الأخرى. 

وفي سبيل ذلك شرع الفريق الفني بشركة Mankind‏ في استخدام منصة سحابة 
Softlayer 1 25s IBM‏ والتي تحتوي على مراكز بيانات وخوادم فلزية معزولة في 
جميع أنحاء العامء مما يساعد ك”i)مةN‏ على القيام مهام أعمالها الحساسة على l3‏ 
عاممي. وبالفعل انخفض وقت تنفيذ تطبيق الشركة بنسبة ZIA‏ وذلك باستخدام خدمة 
البنية التحتية ل :6(ة501. والآن أصبح بإمكان العملاء الحصول على التطبيق في 
غضون ساعات بدلا من 10 يومًا كما كان يحدث في السابق. 
Sources: IBM.com (2014). Softlayer hosting platform reduces application‏ 
implementation time by 987. http//www-03.ibm.com/software/businesscasestudies/‏ 
us/en/corp?synkey-Y979749150926G25 — (accessed August 2016};  ClO.in.‏ 
Mankind Pharma finds an antidote in IBM solution for improving app‏ .)2015( 
implementation time (accessed August 2016). http://www.cio.in/solution-center/‏ 
emc/55281; CxOtoday.com (2014). Cloud platform to help Pharma Co accelerate‏ 
growth. — http://www.cxotoday.com/story/mankind-pharma-to-drive-growth-with-‏ 


softlayers-cloud-platform/(accessed August 2016); Wikipedia.org.(n.d.). Mankind 
Pharma. https://en.wikipedia.org/wiki/Mankind Pharma (accessed August 2016); 
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Mankindpharma.com.  (n.d). Overview. — https://www.mankindpharma.com/ 


company/companyoverview (accessed August 2016). 

الخليج للطيران تستخدم البيانات الضخمة للحصول على رؤية أعمق للعملاء: 

تعتبر الخليج للطيران هي شركة النقل الوطني لدولة البحرين. وهي شركة 
طيران دولية رائدة يعمل بها ٠٠١‏ موظفء. وتخدم £0 مدينة في 76 دولة عبر 7 
قارات. وهي رائدة في توفير الضيافة العربية التقليدية للعملاء. ولمعرفة المزيد عما 
يشعر به عملاؤهم بشأن خدمات ضيافتهم, تابعت الشركة ما يشاركه عملاؤهم على 
وسائل التواصل الاجتماعي في هذا الصدد. وكان التحدي هو تحليل جميع تعليقات 
ومنشورات العملاءء فقد كان هناك مئات الآلاف من المشاركات كل يوم. وتعتبر مراقبة 
هذه المشاركات يدويًا مهمة شاقة ومستهلكة للوقت كما ستكون عرضة للخطأ البشري. 

أرادت شركة الخليج للطيران جعل هذه المهمة وتحليل البيانات لمعرفة الاتجاهات 
السوقية حديثة الظهور تتم بصورة تلقائية. كما أرادت الشركة تأسيس بنية تحتية قوية 
لاستضافة مثل هذا الحل لمراقبة وسائل التواصل الاجتماعي والتي ستكون متاحة على 
مدار الساعة وخفيفة الحركة عبر الحدود الجغرافية. 

طوّرت الخليج للطيران حلا لتحليل المشاعرء ”تحليل المشاعر العربية". والذي يحلل 
منشورات وسائل التواصل الاجتماعي الإنجليزية والعربية. وتستند أداة تحليل المشاعر 
العربية على توزيع 01000618 لإطار عمل م1]12000 للبيانات الضخمة. وهي تعمل 
على بيئة السحابة الخاصة التابعة لشركة الخليج للطيران كما تستخدم منصة غ118 160 
Enterprise Application‏ 18055. تحمل هذه السحابة الخاصة حوالي 00 تيرابايت 
من البيانات» ويمكن لأداة تحليل المشاعر العربية تحليل آلاف المنشورات على وسائل 
التواصل الاجتماعيء مما يوفر نتائج المشاعر في ظرف دقائق. 

وقد حققت شركة الخليج للطيران وفورات جوهرية في التكاليف من خلال وضع 
تطبيق ”تحليل المشاعر العربية* على بيئة السحابة الخاصة الحالية للشركة حيث 
إنهم لم يكونوا بحاجة لأن يستثمروا في إعداد البنية التحتية لنشر التطبيق. وتستعين 
الخليج للطيران بأداة ”تحليل المشاعر العربية“ في تحديد العروض الترويجية لعملائها 
على أساس زمني وتساعدهم على الجلوس في مقدمة منافسيها. ولمواجهة حالة تعطل 
الخادم الأماسيء أنشأت الشركة ”صورًا شبحية“ للخادم هكن نشرها بسرعةء وهكن أن 
تبدأ الصورة في لعب دور الخادم. ويقوم حل البيانات الضخمة بسرعة وكفاءة بالتقاط 
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المنشورات بشكل دوري وتحويلها إلى تقارير. مما يجعل شركة الخليج للطيران على دراية 
تامة بأي تغييرات في المشاعر أو تغيرات في الطلب» مما يمكنها من تقديم استجابة سريعة. 
فكان لأفكار حل البيانات الضخمة أنرًا إيجابيًا على أداء موظفي شركة الخليج للطيران. 

Sources: RedHat.com. (2016). Gulf Air builds private cloud for Big Data innovation 
with Red Hat Technologies. https://www.redhat.com/en/about/press-releases/ 
gulf-air-builds-private-cloud-Big-data-innovation-red-hat-technologies; (accessed 
August 2016); RedHat.com (2016). Gulf Air's Big Data innovation delivers deeper 
customer insight. https://www.redhat.com/en/success-stories(accessed August 
2016); ComputerWeekly.com. (2016). Big-data and open source cloud technology 
help Gulf Air pin down customer sen- timent. http://www.computerweekly.com/ 
news/450297404/Big- data-and-open-source-cloud-technology-help-Gulf-Air-pin- 


down- customer-sentiment (accessed August 2016).‏ 
Chime‏ تحسن تجربة العملاء باستخدام :Snowflake‏ 
Chime zòo‏ وهوخيار مصرفء بطاقة ائتمان فيزاء وحساب 81010 المؤمن للصرف 
والتوفير. وتطبيق على الهاتف الجوال يسهل الخدمات المصرفية للأفراد. وأراد مسؤولو عدسصنط0 
التعرف على مشاركات عملائه. كما أرادوا تحليل البيانات عبر المنصات الخاصة بهم للجؤال» 
والويب. والنهاية الخلفية لتحسين تجربة المستخدم. ومع ذلك» فقد كانت عملية سحب 
البيانات وتجميعها من مصادر متعددة مثل خدمات إعلانات 1هواءءة1 وعاع600 والأحداث 
من الأدوات التحليلية الأخرى JASON Object Notation) JSON Jis cJ «3,3! ássLJl‏ 
مهمة مرهقة. لقد سعوا للوصول إلى حل eai‏ من تجميع البيانات من هذه المصادر 
المتعددة وتحليل مجموعة البيانات. تقد كان 015:6 بحاجة إلى حل يمكنه معالجة مصادر 
بيانات 15021 والاستعلام عنها باستخدام جداول قاعدة بيانات 5Q1‏ امعيارية. 
شر ع 1۳ط في استخذام حل مستودع بيانات Sal 5] Snowflake Elastic‏ 
501131 بسحب البيانات من جميع مصادر بيانات His Chime‏ عددها 
؟١ Kias‏ وقد شمل ذلك بيانات مثل وثائق 75077 من التطبيقات. فقد عملت 
5001121 على مساعدة عدمنطن في تحليل بيانات JSON‏ بسرعة لتحسين خدمات 
الأعضاء وتقديم تجربة مصرفية أكثر خصوصية للعملاء. 
Source: Adapted from Snowflake.net. (n.d.). Chime delivers personalized customer‏ 
experience using Chime. http://wwwsnow-flake.net/product (accessed August 2016).‏ 
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إننا بصدد دخول ”عصر البيتابايت"» وتبداً الأماليب التقليدية للبيانات والتحليلات في 
عرض حدودها. وتعتبر تحليلات السحابة حلا بديلًا حديث الظهور لتحليل البيانات على نطاق 
واسع. وتشتمل الأنظمة السحابية الموجهة بالبيانات على التخزين والحوسبة في بيئة موزعة 
وافتراضية. وتعتبر الليزة الأساسية لهذه العروض هي الانتشار السريع لأدوات التحليل اللتقدمة 
بين المستخدمينء دون استثمار معنوي في الاستحواذ على التقنية. غير أن هذه الحلول يصاحبها 
Lái‏ العديد من التحديات, مثل الأمان ومستوى الخدمة والتحكم في البيانات. فقد اكتنف 
الحوسبة السحابية عدد من المخاوفء منها فقدان السيطرة والخصوصية: والمسؤوليات القانونية, 
والقضايا السياسية عبر الحدود. وما إلى ذلك. Cloud Security Alad Ésgg‏ فإن أخطر ثلاثة 
تهديدات أمنية في السحابة هي فقدان البيانات وتسربهاء وتعطل الأجهزة والمعدات» والواجهة 
غير الآمنة. فجميع البيانات في السحابة يستطيع مقدم الخدمة الوصول إليهاء "T‏ هکنه 
أن يغير البيانات بشكل غير مقصود أو متعمد كما يمكنه تمرير البيانات إلى طرف ثالث لأغراض 
قانونية دون طلب من الشركة. ولا تزال البحوث محدودة في هذا الممجال. وكنتيجة لذلكء فهناك 
فرصة كبيرة لإدخال النمذجة التحليلية والحسابية والمفاهيمية إلى سياق nA] ee:‏ وتوجيه 
الخدمة» والذكاء السحابي. ومع ذلك: تعتبر الحوسبة السحابية مبادرة مهمة لمحترف التحليلات 
أن يشاهدها على أنها مجال سريع النمو. 
أسئلة مراجعة على القسم 8-"؟: 
-١‏ عرّف الحوسبة السحابية. وكيف تتعلق ب 2325 و5345 و1285؟ 
-١‏ أعط أمثلة لشركات تقدم الخدمات السحابية. 
*- كيف تؤثر الحوسبة السحابية على ذكاء الأعمال؟ 
6- كيف يقوم 1285 بتغيير طريقة التعامل مع البيانات؟ 
5- ما هي الأنواع المختلفة للمنصات السحابية؟ 
1- اذا تعتبر 4285 فعالة من حيث التكلفة؟ 
۷- اذكر على الأقل أسماء ثلاثة من كبار مقدمي الخدمات السحابية. 


8- أعط على الأقل ثلاثة أمثلة لقدمي خدمات 4885. 
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۸ التحليلات القائمة على الموقع بالنسبة للمنظمات: 

لقد رأينا حتى الآن العديد من الأمثلة على المنظمات التي تستخدم تقنيات تحليلية من 
أجل اكتساب نظرة ثاقبة في عملياتها الحالية من خلال تقديم ال معلومات» والتحليلات التنبؤية, 
والتوقع» وأساليب الأمثلية. وفي هذا القسم. سوف نتعرف على اتجاه ناشئ بالغ الأهمية وهو 
دمج بيانات الموقع في التحليلات. ويُعطي الشكل (1-8) تصنيقًا للتطبيقات التحليلية القائمة على 
الموقع. وسوف نقوم أولّا باستعراض التطبيقات التي تستفيد من بيانات الموقع الثابتة والتي 
عادةٌ ما تُسمى بالبيانات الجغرافية المكانية. ومن ثَّمّ سنقوم بعد ذلك بفحص التطبيقات التي 
تستفيد من جميع بيانات الموقع الذي يتم إنشاؤه بواسطة أجهزة اليوم. ويركز هذا القسم أولًا 
على تطبيقات التحليلات التي تطورها المنظمات من أجل اتخاذ أفضل قرارات في إدارة العمليات» 
واستهداف العملاء والتقدم» وهكذاء ثم سنقوم أيضًا باستكشاف تطبيقات التحليلات التي يتم 
تطويرها ليستخدمها المستهلك بشكل مباشر كما أن بعضها يستفيد أيضًا من بيانات الموقع. 








التحليلات القاتمة على الموقع 
التوجه بالمستهلك التوجه بالمنظمة 
طريقة المرقع RAS ossa‏ طريقة المرقع المتحراك طريقة الجغرافيا المكانية الثابئة 
تحليل تاريخى وحالى لطاب VLA god ca i‏ 
med pre aon‏ عروض تسويقية فحص مراقع الأماكن الجغرافية 
الشبكات الإجتماعية الصحية الج فى الوقت المناسب 


























شكل 5-8: تصنيف تطبيقات التحليلات القائمة على الموقع 

التحليلات الجغرافية المكانية: 

عادةً ما يتم تمثيل رؤية موحدة للأداء العام للمنظمة من خلال أدوات التصوير ال مرئي التي توفر 
معلومات قابلة للتطبيق. وقد تتضمن المعلومات القيم الحالية والقيم المتوقعة للعوامل التجارية 
المختلفة ومؤشرات الأداء الرئيسة (515). إن النظر في مؤشرات الأداء الرئيسة كأرقام إجمالية 
عبر كل من الرسوم البيانية والمخططات المختلفة يمكن أن يكون ساحقًا. وهناك خطر كبير يتعلق 
بفقدان فرص النمو المحتملة أو عدم تحديد مجالات الجدل. وتستخدم المنظمات الخرائط البصرية 
التي يتم تعيينها جغرافيًا والتي تعتمد على بيانات الموقع التقليدية» كبديل لمجرد عرض التقارير 
وعادةً ما يتم تجميع هذه الخرائط البصرية بواسطة الرموز البريدية. وتعمل الأساليب التحليلية 
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القائمة على الموقع التقليدي والتي تس تخدم الترميز الجغرافي للمواقع التنظيمية والمستهلكين على 
عرقلة المنظمات عن فهم آثار «الموقع الحقيقي». وتقدم المواقع القائمة على الرموز البريدية عرضًا 
مجمعًا لمنطقة جغرافية كبيرة. وهذه الدقة المنخفضة قد لا تساعد في تحديد فرص النمو داخل 
المنطقة. حيث يمكن أن يتغير موقع العملاء المستهدفين بسرعة. وهكذاء فإن الحملات الترويجية 
الخاصة بالمنظمة قد لا تستهدف العملاء المناسبين إذا اعتمدت على الرموز البريدية. ولمعالجة 
هذه المخاوفء فإن المنظمات تضم الموقع والتوسعات المكانية للتحليلات (2010 ,نلهه©). حيث 
إن إضافة مكونات الموقع التي تعتمد على السمات الطولية والعرضية للأساليب التحليلية التقليدية 
تكن المنظمات من إضافة بعد جديد يتعلق بالسؤال «أين» إلى تحليلات الأعمال التقليدية الخاصة 
بهم والذي يُجيب حاليًا على الأسئلة التي تتعلق ب«من» و«ماذا» و«متى» و«ما مقدار». 

الجدير بالذكر أن البيانات التي تعتمد على الوقع يمكن الحصول عليها الآن بسهولة من نظم 
المعلومات الجغرافية (15©)» pii yag‏ لرصد. وتخزينء وتحليل» وإدارة البيانات المرتبطة 
بموقع باستخدام تقنيات الاستشعار المتكاملة, والأنظمة العالمية لتحديد المواقع المثبتة في الهواتف 
الذكيةء أو من خلال نشر تقنية تحديد الهوية باستخدام موجات الرادیو(۸۴12) في مجال البيع 
بالتجزئة وصناعات الرعاية الصحية. 


ومن خلال دمج المعلومات التي تدور حول الموقع مع بيانات الأعمال المهمة الأخرى» تقوم 
ا منظمات عندئذ بإنشاء معلومات للمواقع (2010 ,11708). وتقوم ميزة ذكاء الموقع بتمكين 
المنظمات من اكتساب رؤى دقيقة واتخاذ قرارات أفضل من خلال تحسين كلٍ من العمليات 
والتطبيقات المهمة. وتعمل المنظمات الآن على إنشاء خرائط تفاعلية والتي من شأنها دعم التعمق 
في التفاصيل حول أي موقع, فضلًا عن أنها توفر للمحللين القدرة على البحث عن اتجاهات جديدة 
والربط بين العوامل الخاصة بالموقع عبر مؤشرات الأداء الرئيسة المتعددة -KPI‏ ويمكن للمحللين الآن 
تحديد الاتجاهات والأنماط بدقة في كل من الإيرادات» والمبيعات» والربحية عبر المناطق الجغرافية. 

ومن خلال دمج التفاصيل الدهوغرافية داخل اممواقع» يستطيع تجار التجزئة تحديد 
كيفية اختلاف المبيعات حسب مستوى السكان والقرب من المنافسين الآخرين؛ بالإضافة إلى 
أنهم يستطيعون تقييم الطلب وكفاءة عمليات سلس لة التوريد. كما تستطيع شركات المنتجات 
الاستهلاكية تحديد الاحتياجات الخاصة للعملاء ومواقع شكاوى العملاء وتتبعهم بسهولة وصولًا 
إلى المنتجات. ويمكن لمندوبي المبيعات تحقيق أهدافهم البيعية من خلال تحليل جغرافيتهم. 

وتّعد شركة 18581 (٠ء.1إ5٠)‏ هي الشركة الرائدة في السوق في توفير بيانات أنظمة المعلومات 
الجغرافية؛ حيث تقوم 15181 بترخيص برنامج 850615 الخاص بها لآلاف العملاء بما في ذلك 
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التجاريون» والحكومة» والجيش. وقد يستغرق الأمر كتابًا أو أكثر لتوضيح تطبيقات قاعدة بيانات 
أنظمة المعلومات الجغرافية لشركة 15181 وبرامجها! وهناك شركة أخرى وهى ددمء.دلع لصلمع 
تحدد أكثر من ٠0‏ فئة من تطبيقات أنظمة المعلومات الجغرافية/ددمء .كلع فصاع //:مائط). 
AM aso dUssblog/gis-applications-uses) GIS‏ التي مم نذكرها بعد وتشمل ما يلي: 
- التطبيقات الزراعية: فمن خلال الجمع بين كل من الموقع, والطقس. والتربة» والبيانات المرتبطة 
با محاصيلء يمكن التخطيط بدقة عالية لتطبيقات الري والأسمدة. وتتضمن الأمثلة على ذلك 
بعض الشركات مثل 4$,5 sstsoftware.com‏ وشركة ددمء:ز)5605 (فكل منهما تجمع بين 
أنظمة المعلومات الجغرافية 615 وأحدث المعلومات التي جُمِعَت من خلال طائرات بدون 
طيار وتقنيات أخرى ناشئة). 
- تحليل الجرمة: إن ربط بيانات الجرية بما في ذلك تاريخ الجريمة» ووقتهاء ونوعها مع بيانات 
أنظمة المعلومات الجغرافية يوفر رؤى ثاقبة لأنماط الجريمة وموظفي الشرطة. 
- التنبؤ بانتشار المرض: من أوائل أمثلة التحليلات الوصفية المعروفة تحليل تفشي وباء الكوليرا 
في لندن عام 1806. خطط الدكتور 5001 1012 حالات الكوليرا على خريطة واستطاع دحض 
النظرية التي ترى أن تفشي وباء الكوليرا سببه سوء الهواء. فقد ساعدته الخريطة على أن يحدد 
بدقة أن سبب التفشي يرجع إلى بثر ماء سيئة. (2013 ,10م».همةذ0مهد1266). وقد قطعنا شوطًا 
كبيرًا من الحاجة إلى تخطيط الخرائط يدوياء غير أن الفكرة المتعلقة بالقدرة على تتبع تفشي 
الأمراض ومن تم التنبؤ بهاء Jia‏ الأنفلونزاء باستخدام أنظمة المعلومات الجغرافية 615 والبيانات 
الأغرى أصبحت مجالًا رائدًا في حد ذاته. وقد قدم الفصل السابع مثالا على استخدام بيانات 
وسائل التواصل الاجتماعي مع بيانات أنظمة المعلومات الجغرافية لتحديد اتجاهات الأنفلونزا. 
وبالإضافة إلى ذلك تستطيع المنظمات باستخدام ذكاء الموقع» أن تقوم بتغطية الطقس والآثار 
البيئية بشكل سريع وتوقع مستوى التأثير على عمليات الأعمال المهمة. ومع التقدم التقني» يتم 
الآن إدراج البيانات الجغرافية المكانية مباشرةٌ في مستودعات بيانات اممؤسسة» وتقوم تحليلات 
قاعدة البيانات التي تعتمد على الموقع بتمكين المنظمات من إجراء العمليات الحسابية المُعقدة 
بكفاءة عالية والحصول على رؤية واحدة لجميع البيانات الموجهة مكانيًاء وكشف الاتجاهات 
المختبئة والفرص الجديدة. Aiad‏ يدعم مستودع البيانات الخاص ب تيراداتا ميزة البيانات 
الجغرافية المكانية معتمدًا على اللعيار 501:/3434. ويتم رصد ميزة الجغرافيا المكانية كنوع 
بيانات هندسي ST. GEOMETRY Lj ud A432‏ وهو يدعم مجموعة كبيرة من الأشكال من 
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blä‏ بسيطةء وخطوط وينحني إلى المضلعات المعقدة في تمثيل ال مناطق الجغرافيةء وهم يقومون 
بتحويل البيانات غير المتداخلة الخاصة مواقع أعمالهم التشغيلية من خلال دمج إحداثيات 
خطوط الطول والعرض. ويتم دعم هذه العملية الخاصة بالترميز الجغرافي بسهولة من قبل 
شركات الخدمات مثل 4555 Tele Atlas à $559 .NAVTEQ‏ والتي تحافظ على قواعد بيانات 
عالمية للعناوين ذات الخصائص الجغرافية المكانية والاستفادة من أدوات تنظيف العناوين مثل 
Trilliumg Informatica‏ واللتان تدعمان رسم خرائط الإحداثيات المكانية للعناوين كجزء من 
وظائف الاستخراجء والتحويلء والتنزيل. 
وتقوم المنظمات عبر مجموعة متنوعة من قطاعات الأعمال باستخدام التحليلات الجغرافية 
المكانية. وسنقوم فيما يلي باستعراض بعض الأمثلة؛ حيث تقدم حالة عملية LAS de Jis (E-A)‏ 
استخدام المعلومات التي تستند إلى الموقع في اتخاذ قرارات اختيار الموقع في توسيع رقعة الشركة. 
وتوضح حالة عملية (0-8) تطبيقًا آخر والذي يتجاوز مجرد قرار الموقع. 
حالة عملية ٤-۸‏ 
اها تستخدم التحليلات ال مكانية لتوفير الوقت في قرارات الموقع 
يعد 5م01 6626 أكبر وأسرع صالونات الشعر في العام نهوًاء وله أكثر من ٠٠٠٠١‏ فرع 
ما بين الولايات المتحدة الأمريكية وكندا. يعتمد نجاح 5م011 67626 في منح حق الامتياز 
للغير على إستراتيجية نمو قائمة على افتتاح فروع جديدة بشكل سريع في المواقع والأسواق 
المناسبة. كانت Clips‏ 2681© بحاجة إلى تحليل المواقع بناءً على متطلبات قاعدة العملاء 
ال محتملة: والاتجاهات الدهموغرافية: وأثر cols‏ على حقوق الامتياز القائمة بالفعل 
في ا موقع اللمستهدف. ومن الأهمية بمكان في هذا الصدد اختيار ا موقع الجيد. وقد 
استغرقت العمليات الحالية وقنًا طويلًَا لتحليل موقع واحد وعدد هائل من العمالة 
يتطلب موارد تحليل مكثفة لتقييم البيانات بشكل يدوي من مصادر البيانات المتعددة. 
ومع آلاف المواقع التي يتم تحليلها في كل عام كان التأخير ينذر بخطر خسارة 
المواقع الأولية لحساب المنافسين كما كان يبرهن على تكلفتها الباهظة؛ فاستعانت 
ومف1© غدع:© مقاولين خارجيين للتغلب على مشكلة التأخير. وقامت الشركة بإنشاء 
تطبيق سير عمل اختيار الموقع لتقييم أماكن الفروع الجديدة باستخدام الإمكانيات 
التحليلية للجغرافيا المكانية التابعة لشركة »(41165. وأي موقع جديد يتم تقييمه من 
خلال وقت القيادة التقريبية إليه وسهولة خدمة جميع العملاء الموجودين في محيط 
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£L تقييم كل موقع جديد‎ i$ Alteryx الحل القائم على‎ Ša LS Great Clips å 
على البيانات الدهوغرافية والسلوكية للمستهلكينء والتوافق مع ملفات تعريف عملاء‎ 
ئ اهاي الحاليين والآثر المحتمل لإيرادات الموقع الجديد على المواقع الموجودة من‎ 
Great قبل. وكنتيجة لاستخدام فنيات التحليل القائمة على الموقع. استطاعت ومناك‎ 
تقليل وقت تقييم المواقع الجديدة بنسبة 10< تقريبًاء وتم إجراء التحليل المكثف‎ 
للعمالة بصورة آلية وتم تطويره في تحليل جمع البيانات» ورسم الخرائطء وتطبيق إعداد‎ 
التقارير التي هكن استخدامها بسهولة من قبل مديري العقارات غير الفنيين. بالإضافة‎ 
إلى ذلكء تمكنت الشركة من تنفيذ تحليلات تنبؤية مسبقة لأي موقع جديدء بحيث‎ 
لا تستغرق العملية بأكملها الآن سوى بضع دقائق.‎ 

أسئلة للمناقشة: 

3Great Clips كيف يتم استخدام تحليلات الجغرافيا الممكانية في‎ -١ 


۲- ما هي المعايير التي ينبغي على الشركة مراعاتها عند تقييم أماكن المواقع 
الجديدة في المستقبل؟ 
-٠‏ هل تستطيع التفكير في تطبيقات أخرى قد تستفيد من بيانات الجغرافيا المكانية؟ 
Source: Adapted from Alteryx.com. (n.d.). Great Clips. alteryx.com/sites/default/‏ 
files/resources/files/case-study-great-chips.pdf (accessed August 2016).‏ 
حالة عملية 0-4 
ستاربكس تستغل نظم ال معلومات الجغرافية (615©) وتحليلاتها لتنمو في كل أنحاء العام 
يعتبر أحد أهم التحديات التي تواجه أي منظمة تسعى للتوسع هو تحديد موقع 
فرعها «lil‏ وهذا ما تواجهه ستاربكس. ولتحديد مواقع فروع جديدة. يقوم أكثر من 
٠‏ موظف في ستاربكس (يشار إليهم كشركاء) في ١0‏ دولة باستخدام تخطيط السوق 
القائم على 456015 وحل ذكاء الأعمال الذي يسمى 4]135؛ حيث تمد Spå! Atlas‏ 
بمهام سير العمل والتحليل ومعلومات عن أداء الفرع بحيث يمكن للشركاء المحليين في 
المجال اتخاذ القرارات عند تحديد فرص أعمال جديدة. 
وكما ذكرت تقارير مصادر متعددة. يستخدم صانعو القرار الطحليين 81125 لفهم 
الاتجاهات السكانية والطلب. فيوجد في الصين s‏ أكثر من ١٠١‏ فرع ل «ossa las‏ 
وتقوم الشركة بافتتاح فرع جديد كل يوم تقريبًا. وفي سبيل تحديد موقع الفرع التالي 
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تكون الشركة بحاجة لكثير من المعلومات عن المناطق التجارية وتجمعات بيع التجزئة 
وا مولدات والحركة المرورية والمعلومات الدموغرافية. وبعد تحليل السوق والحي 
الجديدين. يستطيع المدير الحصول على نظرة مكبرة لمواقع محددة في أي منطقة في 
امدينةء ومن تَمٌ تحديد ثلاثة أبراج مكتبية جديدة يمكن أن تكتمل في غضون شهرين 
مثلًا. وبعد عرض هذه ا منطقة على الخريطة: يمكن إنشاء نافذة لسير العمل والتي 
سوف تساعد المدير على متابعة حركة الموقع الجديد بدءً بالموافقة» مرورًا بالتصاريح, 
ثم التشييدء pil flo‏ 


ويمكن أيضًا إدارة عمليات الطلب وسلاسل التوريد بشكل أفضلء وذلك من خلال 
تكامل بيانات الطقس مع البيانات المحلية الأخرى. وتسعى ستاربكس لتكامل أنظمة 
أعمالها مع حلول نظم (615) الخاصة بها في خدمات الويب للحصول على رؤية جديدة 
للأعمال في جميع أنحاء العالم. فمثلًاء تقوم ستاربكس بدمج توقع بيانات درجة الحرارة 
الحقيقية التي تتنبأ بها أرصاد. ويمكن أن تساعد هذه البيانات المتوقعة لدرجات 
الحرارة في تمركز الجهود التسويقية. ومع اقتراب الأسبوع شديد الحرارة في ممفيسء 
يكن ملحللي ستاربكس اختيار مجموعة من بيوت القهوة والحصول على معلومات 
مفصلة عن أنماط الطقس في الماضي وال مستقبلء بالإضافة إلى خصائص الفرع. ويمكن 
استخدام هذه ا معرفة لتصميم ترويج محلي لفرابتشينو «Mia .Frappuccinos‏ يمكن 
مساعدة ستاربكس على توقع ما سيطلبه عملاؤه لأسبوع مقدماء 

وللأحداث الكبيرة أيضَا أثرٌ على بيوت القهوة. فعندما نزل ١6١‏ ألف شخص في 
موكب كبير في م1168 هه5. قام السقاة المحليون بخدمة الكثير من العملاء. ولضمان 
أفضل تجربة ممكنة للعميل. استخدمت ستاربكس هذه المعرفة بالحدث المحلي 
لتخطيط طاقم العمل وا مخزون في مواقع قريبة من املوكب. 

أسئلة للمناقشة: 


-١‏ ما هو نوع المعلومات الديموغرافية ومعلومات 615 التي قد تتعلق بقرار تحديد 
موقع الفرع؟ 

'- من المعلوم أن ستاربكس تشجع عملاءها على استخدام تطبيق الجوال الخاص 
بها. ما هو نوع المعلومات التي ربما تلتقطها الشركة من التطبيق لمساعدتها في التخطيط 
الأفضل للعمليات؟ 
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- هل إتاحة 181-11 بالمجان في فروع ستاربكس ستقدم أي معلومات إلى ستاربكس 

من أجل تحليلات أفضل؟ 
Sources: Digit. HBS.org (2015). Starbucks: Brewing up a data storm! https:;//digit.hbs.‏ 
org/submission/Starbucks-brewing-up-a-data-storm/(accessed August 2016); Wheeler,‏ 
C. (2014). Going Big with GIS. http;//www.esri.com/esri-news/arcwatch/0814/‏ 
going-Big-with-gis (accessed August 2016); Blogs.ESRLcom. From customers to‏ 
CxOs, Starbucks delivers world-class service. (2014). https//blogs.esri.com/esri/‏ 
ucinsider/201429/07//Starbucks/(accessed August 2016).‏ 


وبالإضافة إلى تطبيقات تحليل معاملات التجزئة التي أبرزناه ا هناء فهناك تطبيقات أخرى 
متعددة للجمع بين المعلومات الجغرافية وبين البيانات الأخرى التي يتم إنشاؤها من قبل ال منظمة. 
فعلى سبيل المثالء غالبًا ما تنتج عمليات الشبكة وشركات الاتصالات كميات هائلة من البيانات 
اليوم. وتسطيع القدرة على تحليل البيانات بسرعة مع مستوى عالٍ من التفاصيل الخاصة بالموقع 
أن تحدد بشكل أفضل الاضطراب عند العميل ومن تم تقوم با مساعدة في صياغة إستراتيجيات 
خاصة بالمواقع من أجل زيادة كل من الكفاءة التشغيليةء وجودة الخدمة» والأرباح. 

ويستطيع التحليل الجغرافي المكاني أن تمَكّن شركات الاتصالات من رصد المعاملات اليومية من 
الشبكة لتحديد المناطق الجغرافية التي تعاني من فشل عدد كبير من محاولات الاتصال الخاصة 
بالصوت» أو البياناتء أو النص» أو الإنترنت. وتستطيع التحليلات أن تساعد في تحديد الأسباب 
الدقيقة اعتمادًا على الموقع والانتقال إلى عميل فردي من أجل توفير خدمة عملاء أفضل. ويمكنك 
أن تلمس ذلك أثناء العمل عن طريق إكمال تمرين الوسائط المتعددة التالي. 
تمرين الوسائط المتعددة في تحليلات تستخدم التحليلات الجغرافية المكانية: 

تشتمل شبكة جامعة تيراداتاعلى فيديو 851 في حالة فشل مكاممات الهاتف المحمول. يُرجى مشاهدة 
الفيديو المتاح على موقع http://www.teradatauniversitynetwork. :JUJI Ja. 1l «& v25593‏ 
-com/Library/Items/BSI- The-Case-of-the-Dropped-Mobile-Calls./‏ 

وتطلق شركة اتصالات خطًا جديدًا من الهواتف الذكية وتواجه مشاكل مع انخفاض المكامات. 
وتتعرض عملية الطرح الجديد إلى مشاكلء وتعتبر المنطقة الشمالية الشرقية هي المنطقة الأكثر 
تضررًا حيث يقومون بمقارنة تأثيرات المكالمات المفقودة على أرباح المنطقة الجغرافية. وتقوم 
الشركة بإيجار 851 لتحليل المشاكل الناجمة عن عيوب الهواتف الذكيةء وتغطية البرج» ومواطن 
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خلل البرمجيات. وتنقسم بيانات المنطقة الشمالية الشرقية بأكملها إلى مجموعات جغرافية, 
وتقوم الشركة بحل المشكلة من خلال تحديد بيانات العملاء الفردية. ويستخدم فريق 851 
التحليلات الجغرافية المكانية لتحديد المواقع التي تؤدي فيها تغطية الشبكة إلى انخفاض SUKI‏ 
وتقترح تثبيت بضعة أبراج إضافية في موقع العملاء غير الراضين عن الخدمة. 
وبعد اكتمال الفيديو, يمكنك الاطلاع على كيفية إعداد التحليل عبر: 
slideshare.net/Teradata/bsi- Teradata-the-case-of-the-dropped-mobile-calls.‏ 


وتقدم هذه النزهة من الوسائل المتعددة مثالًا على مجموعة من التحليلات الجغرافية المكانية 
بجانب تحليلات البيانات الضخمة التي تساعد في اتخاذ القرارات بشكل أفضل. 


ذكاء الموقع الفوري: 


تقوم العديد من الأجهزة المستخدمة بواسطة المستهلكين والمهنيين بإرسال معلومات الموقع 
الخاصة بهم بوتيرة ثابتة. وتقوم السيارات والحافلات وسيارات الأجرة وأجهزة الجوال والكاميرات 
وأجهزة التنقل الشخصية ببث إشارات مواقعها باستخدام تقنيات تحديد المواقع المتصلة بالشبكة 
-cell tower triangulationg Wi-Fis (GPS) |a‏ 

ويستخدم الملايين من المستهلكين وأصحاب الأعمال الأجهزة الممكّنة بالموقع للعثور على خدمات 
قريبةء وموقع الأصدقاء والعائلة. والتنقلء وتعقب الأصول والحيوانات الأليفة, والاشتراك في الألعاب 
الرياضية: والهوايات. وقد أدى هذا الاندفاع القوي في الخدمات الممكنة با موقع إلى قاعدة بيانات 
ضخمة من المعلومات التاريخية ومعلومات الموقع المتدفقة أولًا بأولء وهي بالتأكيد متفرقة وغير 
مفيدة في حد ذاتها. حيث تقدم مجموعة البيانات الآلية التي تم تمكينها من خلال التقاط الهواتف 
الخلوية ونقاط الوصول الساخنة إلى 1171-11 بُعدًَا جديدًا مثيرا للاهتمام في أبحاث السوق غير 
المتداخلة, وجمع البيانات» وبالطبع؛ التحليل الدقيق مثل هذه المجموعات الضخمة من البيانات. 

ويمكن من خلال التحليل والتعلم من هذه الأنماط واسعة النطاق للحركة: أن يتم تحديد 
فئات متميزة من السلوكيات في سياقات محددة. ويسمح هذا النهج لأصحاب الأعمال بفهم أنماط 
عملائهم بشكل أفضل واتخاذ قرارات أقوى بشأن العروض الترويجية والتسعير وما إلى ذلك. كما 
يمكن من خلال تطبيق الخوارزميات التي تقلل من أبعاد بيانات الموقع» أن يتم تميبز الأماكن وفقًا 
للنشاط والتنقل بينها. ومن الكميات الهائلة لبيانات الموقع ذات الأبعاد المرتفعة. تكشف هذه 
الخوارزميات عن اتجاهات ومعانِ وعلاقات تنتج في النهاية تمثيلات سهلة الفهم للبشر ثم يصبح 
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بعد ذلك من الممكن استخدام مثل هذه البيانات لعمل تنبوات ذكية تلقائيًا وإيجاد أوجه تطابق 
وتشابه مهمة بين الأماكن والأفراد. ويظهر تطبيق التحليلات القائمة على ا موقع في تطبيقات 
التسويق الموجهة بالمستهلك. 359 Quiznos pë‏ وهومطعم خدمات سريعة: باستخدام منصة 
0115 56056 لتحليل مسارات المواقع للمستخدمي الجوال بناءً على البيانات الجغرافية المكانية 
المتحصل عليها من نظام (625) والعملاء المستهدفين من الذكاء التقني باستخدام الكوبونات. 
انظر حالة عملية (1-۸). توضح هذه الحالة الاتجاه الحديث في مجال بيع التجزئة حيث تتطلع 
الشركات إلى رفع كفاءة الحملات التسويقية» ليس فقط من خلال استهداف كل عميل بناءً على 
موقعه الحاليء ولكن عن طريق استخدام تحليلات تنبؤية أكثر تطورًا في الوقت المناسب على 
خصائص المستهلكين السلوكية لإيجاد المجموعة الصحيحة من المستهلكين للحملات الإعلانية. 
حالة عملية 5-8 
مطعم 0112805 يستهدف عملاء للسندويشات التي يقدمها 
قام مطعم 01112305 الحاصل على حق امتياز للخدمة السريعة:؛ بتنفيذ حملة 
استهداف أجهزة الجوال القائمة على الموقع والتي استهدفت مستهلكين ذوي دهاء تقني 
وغير متفرغين من مدينة بورتلاند. بولاية أوريجون. واستخدمت الحملة Sense iaw‏ 
(Networks‏ والتي قامت بتحليل مسارات مواقع مستخدمي الجوال لفترات زمنية مفضلة. 
وقامت بإنشاء ملفات شخصية مجهولة بناءًٌ على السمات السلوكية لعادات التسوق. 
وبتطبيق التحليلات التنبؤية على الملفات الشخصية للمستخدمينء قام مطعم 
5 بباستخدام الاستهداف السلوقي المبني على الموقع لتقليل خصائص المستخدمين 
المحتمل تناولهم للأكل في مطعم الخدمة السريعة أكثر من غيرهم. واستمرت هذه 
الحملة الإعلانية لمدة شهرين - نوفمير وديس مبر 7١17‏ - واستهدفت فقط العملاء 
الذين تتراوح أعمارهم بين 18 و6 عامًا والمحتمل تواجدهم في مطاعم الخدمة السريعة 
خلال الثلاثين يومًا السابقة» في حدود ٠١‏ ميلًا مربعًا تقريبًا حول „Quiznos pazh‏ 
واستخدمت إعلانات الجوال ذات الصلة بالكوبونات المحلية بناءٌ على موقع العميل. 
وقد نتج عن هذه الحملة أكثر من ۲,۷ مليون عميل جديد وزيادة بنسبة ×۲١‏ قي 
عمليات استرداد الكوبونات داخل منطقة بورتلاند. 
أسئلة للمناقشة: 


-١‏ كيف يمكن أن تساعد التحليلات القائمة على الموقع تجار التجزئة في استهداف العملاء؟ 
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oå -Y‏ بالبحث عن تطبيقات مشابهة للتحليلات قائمة على ال موقع في مجال بيع التجزثة. 
Source: Adapted from Mobilemarketer.com (2013). Quiznos sees 20pc boost in‏ 


coupon redemption via location-based mobile ad campaign. mobilemarketer.com/ 


cms/news/advertising/14738.html (accessed August 2016). 

ولا زال هناك امتداد آخر للتحليلات القائمة على الموقع وهو استخدام الواقع المعزز. في 
عام Pokémon GO lga Lu] 485 a dno cogo Y V‏ وهي لعبة قائمة على الواقع معززة 
باستشعار الموقع حيث تشجع المستخدمين على المطالبة بأشياء افتراضية من المواقع الجغرافية 
المنتقاة. فيستطيع المستخدم أن يبدأ من أي مكان في المدينة ويسير وفقًا لعلامات على التطبيق 
للوصول إلى بند معين. وتكون الأشياء الافتراضية مرئية من خلال التطبيق عندما يوجه ا مستخدم 
كاميرا الهاتف باتجاه أي منهاء ويستطيع المستخدم بعد ذلك أن يطالب بذلك الشيء. وتعد 
تطبيقات الأعمال بمثل هذه التقنيات أيضًا حديثة الظهور. على سبيل المثال» يوجد تطبيق يسمى 
Candybar‏ يسمح هذا التطبيق لأصحاب الأعمال بوضع هذه الأشياء الافتراضية على خريطة 
باستخدام خرائط ع[ع6008. كما يمكن باستخدام l5 glos aas Google Street View‏ 
الأشياء بمزيد من الدقة» وبمجرد أن يتم تنسيق كل البنود الافتراضية مع المعلومات وا موقع» يصبح 
بإمكان صاحب العمل أن يبث بنودًا مرئية للمستخدم بشكل فوري. كما يوفر táf Candybar‏ 
تحليلات استخدام الأعمال لتمكين استهداف أفضل للأشياء الافتراضية. ويعمل جانب الواقع 
الافتراضي لهذا التطبيق على تحسين تجربة المستخدمين, بتوفير بيئة ”ألعاب“ لهم في الحياة 
الواقعية. وفي نفس الوقتء يوفر منصة تسويق قوية لأصحاب الأعمال للوصول إلى عملائهم. 

وكما هو واضح من هذا القسمء فقد تصبح التحليلات القانئمة على الموقع والتطبيقات الناتجة 
عنها هي أهم واجهة للمنظمات في المستقبل القريب. وكان استخدام البيانات التشغيلية أو 
التسويقية من قبل المنظمات واحدًا من الأفكار الشائعة في هذا القسم. وسوف نقوم لاحقًا 
باستكشاف تطبيقات التحليلات التي تستهدف المستخدمين بشكل مباشر وفي بعض الأحيان 
تستغل ميزة معلومات الموقع. 


لقد 3l‏ النمو الهائل à‏ صناعة التطبيقات لمنصات الهواتف الذكية (105 Androida‏ 
às (las.5 ls9 Windows s‏ استخدام التحليلات l‏ كبيرة لتطوير التطبيقات حيث يستخدم 
المستهلكون التحليلات دون إدراك. وتختلف هذه التطبيقات عن الفتة السابقة في أنها معنية 
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بالاستخدام المباشر للمستهلكء بدلا من المنظمة التي تحاول التنقيب في بيانات المستخدم المتعلقة 
بالاستخدام / بالشراء لإنشاء ملف تعريف لتسويق منتجات أو خدمات محددة. ووفقًا للتنبؤات» 
تعمد هذه التطبيقات إلى تمكين المستهلكين من اتخاذ قرارات أفضل عن طريق استخدام تحليلات 
محددة. ونستعرض فيما يلي مثالين على ذلك. 

يعمل 11826 - وهو تطبيق ويب اجتماعي - على مساعدة المستخدمين في تحديد مسار 
التنقل وتنبيه المستخدمين بال مش كلات المحتملة مثل الحوادث ونقاط التفتيش وأجهزة مراقبة 
السرعة ومواقع أعمال البناء على الطريق» وذلك بناءً على مدخلات مستخدمين آخرين. وقد 
أصبح 18826 أحد أكثر تطبيقات التنقل انتشارًا. وقد حصلت ع1ع600 على هذا التطبيق منذ 
بضع سنوات» وعملت على تحسينه. ويعد هذا التطبيق مثالا على تجميع المعلومات التي ينشئها 
ا مستخدم وجعلها متاحة للعملاء. 

تسمح الكثير من التطبيقات للمستخدمين بإرسال الاستعراضات والتصنيفات لأصحاب الأعمال 
والمنتجات وما إلى ذلك» ومن ثَّمّ تقديمها للمستخدمين في صورة متكاملة للمساعدتهم في وضع خيارات. 
ويمكن تعريف هذه التطبيقات أيضًا كتطبيقات مبنية على بيانات اجتماعية تستهدف المستهلكين 
حيث يقومون بإنشاء البيانات. ويعتبر ماعلا أحد التطبيقات الأكثر رواجًا بين تطبيقات الفئة. 

وتم نشر تطبيق آخر مرتبط بالنقل يستخدم التحليلات التنبؤية في بيتس بيرج بنسلفانيا. وقد 
تم تطويره بالتعاون مع جامعة 108ا26 عنعءم:02: ويشمل هذا التطبيق إمكانيات تنبؤية لتقدير 
توافر مواقف السيارات. ويقوم 2915011 بتوجيه السائقين إلى المناطق التي تتوفر فيها مواقف 
للسيارات. فهو يقوم بحساب عدد أماكن وقوف السيارات المتاحة في ٠١‏ مواقف والتي تتجاوز 01٠٠١‏ 
مساحة و٥۲‏ من مواقف السيارات في وسط مدينة بيتس بيرج. ويتم تحديث المساحات المتاحة 
كل ٠١‏ ثانية» مما يحفظ تواجد السائق بالقرب من الأماكن المتاحة قدر الإمكان. وبالاعتماد على 
الطلب التاريخي والأحداث الحالية» يكون التطبيق قادرًا على التنبؤ بتوفر مواقف للسيارات وتوفير 
معلومات عن المساحة التي ستكون متاحة مع الوقت الذي يصل فيه السائق إلى المكان المقصود. 
وتستخدم الخوارزمية الأماسية للتطبيق بيانات حول الأحداث الجارية حول المنطقة - على سبيل 
ا مثالء لعبة كرة السلة - للتنبؤ بزيادة في الطلب على أماكن وقوف السيارات في وقت لاحق من ذلك 
اليوم» وبالتالي توفير وقت ثمين للمسافرين للبحث عن أماكن وقوف السيارات في المدينة المشغولة. 

لم تكن نشأة التطبيقات القائمة على التحليلات فقط للمرح والصحة: ولكنها ظهرت كذلك 
لتعزيز إنتاجية الفرد. فعلى سبيل المثالء تتواجد التطبيقات 1026© و0134 وغيرها في مكان 
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واحد. ويقوم تطبيق 01026 بإدارة صناديق الرسائل الواردة للعديد من حسابات البريد 
الإلكتروني بجانب حسابات أخرى لوسائل التواصل الاجتماعي. فهو يقوم بعمل تكامل بين 
الشبكات الاجتماعية وجهات اتصال البريد الإلكتروني المعرفة أي من جهات الاتصال تكون أكثر 
أهمية من غيرها ويقوم بإعطائها درجات» بحيث تحصل جهات الاتصال المهمة علي درجة أعلى. 
فيتم عرض رسائل البريد الإلكتروني ذات الدرجات الأعلى أولاء وبالتالي يقوم بإبعاد البريد الأقل 
أهمية وغير ذي الصلة. ويعمل 01026 على تخزين سياق كل محادثة لتوفير الوقت عند العودة 
لمكالمة معلقة. ويتم تنظيم جهات الاتصال في مجموعات بناءً على عدد مرات تكرار تفاعلهاء مما 
يساعد المستخدمين على البقاء على اتصال مع الأفراد الذين قد يفقدون الاتصال بهم. ويمكن 
للمستخدمين وضع درجات 01026 للأفراد الذين يريدون الحصول على اتصال بهم والعمل على 
تحسين هذه الدرجة. ويقوم 01026 برفع درجة كلما حدثت محاولة اتصال. فعلى سبيل المثال» 
عند فتح أي بريد إلكتروني يوفر 01026 عدة خيارات» Ie" esI" SI" Jis‏ ”الأسبوع 
القادم“ والتي تُذكّر المستخدم تلقائيًا أن يبدأ الاتصال وفقًا للجدول الزمني. ويعمل هذا كتذكير 
للرجوع إلى رسائل البريد الإلكتروني في وقت لاحقء دون نسيانها أو وضع علامة ”غير مقروء“عليهاء 
والتي غالبًا ما تؤدي إلى ازدحام صندوق الوارد. ولأن 01026 الآن أصبح مستهدقًا كتطبيق إنتاجي 
للأعمالء تعتبر أسعاره حاليًا أكبر من إمكانيات المستهلك. 

وكما يتضح من هذه الأمثلة للتطبيقات المرتكزة على المستهلك. تبدأ التحليلات التنبؤية 
في تمكين تطوير البرمجيات التي يستخدمها المستهلك مباشرة. وتقدّر مجلة Wall Street‏ 
coliudazl elo eo (wsj.com/apps)‏ الذي وصل بالفعل لقيمة 0 مليار دولار بنمو 
متوقع أكبر. ونحن نؤمن بأن نمو التطبيقات التحليلية الموجهة با مستهلك سيستمر ويصنع 
الكثير من فرص الأعمال الحرّة لقراء هذا الكتاب. 

ويتمثل أحد أهم المخاوف من استخدام هذه التقنيات في فقدان الخصوصية. فإذا استطاع 
أي شخص تنبع حركة انتقال الهاتف الخلويء تكون خصوصية هذا العميل مشكلة كبيرة؛ إذ يدعي 
بعض مطوري التطبيقات آنهم بحاجة فقط إلى جمع معلومات تدفق مجمعةء وليس المعلومات 
سهلة التحديد بشكل فرديء في حين تظهر الكثير من القصص في وسائل الإعلام تسلط الضوء على 
اختراقات لهذا المبدأ العام. ويجب أن يكون لدى كل من المستخدمين والمطورين لهذه التطبيقات 
الوعي التام بالأثر الضار الناجم عن منح معلومات خاصة فضلًا عن جمع مثل هذه المعلومات. 
وفي القسم التالي سوف نناقش هذه القضية بشيء من التفصيل. 
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أسئلة مراجعة على القسم 6-8: 
-١‏ كيف تستخدم التحليلات التقليدية البيانات القائمة على الموقع؟ 
۲- كيف هكن أن تساعد المواقع اممكودة جغرافيًا في اتخاذ قرار أفضل؟ 
-Y‏ ما هي القيمة المضافة بواسطة التحليلات الجغرافية المكانية؟ 
ع- قم باستكشاف استخدام التحليلات الجغرافية المكانية بشكل أكبر من خلال التحقق من 
استخدامها عبر قطاعات متنوعة مثل تتبع التعداد الحكوميء والتسويق للمستهلك؛ وما إلى ذلك. 
oë -0‏ بالبحث على الإنترنت عن تطبيقات أخرى للتطبيقات التحليلية الموجهة بالمستهلك. 
1- كيف هكن للتحليلات القائمة على الموقع أن تساعد المستهلكين الأفراد؟ 
- قم باستكشاف المزيد من تطبيقات النقل التي قد تستخدم تحليلات قائمة على الموقع. 
8- ما هي التطبيقات الأخرى التي يمكنك تخيلها إذا كنت قادرًا على الوصول إلى بيانات موقع الهاتف الخلوي؟ 
۸ القضايا القانونية» والخصوصية. والأخلاقية: 
لقد تطورت تطبيقات علم البيانات» والتحليلات» والحوسبة الإدراكية» بالإضافة إلى الذكاء 
الاصطناعي في إمكانية الوصول إليها وانتشارهاء وقد أدى هذا التطور إلى تأثر كل شخص بهذه 
التطبيقات. ومجرد إمكانية تحقيق شيء من خلال التقنية» لا تجعله شيئًا مناسبًاء أو قانونيًه أو 
أخلاقيًا. ويجب أن يكون متخصصو علم البيانات والمديرون على وعي تام بهذه المخاوف. وترتبط 
العديد من القضايا القانونية, والخصوصية. والأخلاقية المهمة بالتحليلات. ونقدم هنا أمثلة معبرة 
ومصادر فقط. La oleg‏ تكون وسائل الإعلام المنتشرة حريصة للغاية على الإبلاغ عن مثل هذه 
الانتهاكات للسلوك القانوني والأخلاقي. لذلك؛ فإن هذا القتسم هو أحد الأقسام الذي قد يمكنك 
العثور فيه على المزيد من الأمثلة الحديثة عبر الإنترنت. وكما أشرنا في الفصل الأول» فإننا نهدف 
هنا فقط لإطلاعك على هذه القضايا. وينبغي على فرّق الفصل الخاص بك أن تحدد حالات 
أحدث وتقوم بمناقشة هذه الحالات. 
القضايا القانونية: 
قد يؤدي إدخال التحليلات إلى تفاقم مجموعة كبيرة من القضايا القانونية التي لها صلة فعلية 
بأنظمة الحاسب. وعلى سبيل المثال» فإن الأسئلة المتعلقة با مسؤولية عن أعمال المشورة المقدمة 
من الآلات الذكية بدأت تؤخذ بعين الاعتبار. 
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وبالإضافة إلى حل النزاعات حول نتائج بعض التحليلات غير المتوقعة بل وربما الضارة, فإنه 
قد تظهر قضايا أخرى معقدة, مثل: مَن الذي يتحمل المسؤولية في حالة ما إذا وجدت اللؤسسة 
نفسها مفلسة نتيجة لاستخدام نصيحة تطبيق تحليلي؟ هل ستتحمل المؤسسة المسؤولية لعدم 
اختبار النظام بشكل كاف قبل إسناد قضايا حساسة له؟ هل ستشارك شركات التدقيق والمحاسبة 
في المسؤولية عن الفشل في تطبيق اختبارات تدقيق كافية؟ هل سيكون لمطوري البرمجيات 
الخاصة بالأنظمة الذكية دور في المسؤولية؟ عندما تصبح السيارات ذاتية القيادة أكثر انتشارًاء 
من سيكون المسؤول عن أي ضرر أو تلف عندما تتعطل أجهزة استشعار السيارة أو الشبكة أو 
التحليلات في العمل كما هو مُخطط لها؟ وهناك حالة حديثة تتعلق بحادث سيارة ۲۲1٩‏ حيث 
مات السائق بينما أظهرت السيارة أنها في وضع الطيار الآلي «ا0لزم2010» وقد تقلت هذه القضية 
على الصفحات الأولى من الصُّحُف وال مهن القانونية. 
وقدمت الحالة العملية (1-1) أمثلة على استخدام البيانات البديلة في استخدام معلومات 
إضافية من أجل توقعات صائبة بشأن مخرجات الحصيلة المستقبلية» ومبيعات الشركة» وغيرها. 
وعلى الرغم من أن هذه الأدوات اليوم لا تفرض قيودًا تقليدية على التداول من الداخل نظرًا 
لعدم مشاركة أي شخص داخل الشركة للمعلومات غير العامة: إلا أنه رها لا تزال هناك مشاكل 
حول الحصول على المعلومات التي تكون غير متاحة للعامة. وقد لاحظ 515167 (2015) أن أي 
تاجر في السوق يستخدم التحليلات والبيانات البديلة لابد أن يكون على علم بقواعد المعلومات 
المفروضة من قبل الهيئات التنظيمية المالية. وعادةً ما تكون الأفكار المستمدة من البيانات 
العامة آمنة نظرًا لعدم الحصول عليها بشكل مباشر من مصادر داخلية. 
تأمل المسائل القانونية المُحددة التالية: 
- ما قيمة رأي الخبير في المجال إذا ما تم تشغير الخبرة في الحاسب؟ 
- من هو المسؤول عن النصيحة (أو المعلومات) الخاطئة التي يقدمها أحد التطبيقات الذكية؟ 
فمثلاء ماذا يحدث إذا صدق الطبيب تشخيصًا غير صحيح شخّصه جهاز الحاسب وقام الطبيب 
على أساسه باتخاذ إجراء تسبب في وفاة أحد المرضى؟ 
- ماذا يحدث لو قام أحد ا مديرين بإدخال تقييم حكمي غير صحيح في تطبيق تحليلي وكانت 
النتيجة حدوث ضرر أو كارثة؟ 


- من الذي يلك المعرفة في قاعدة المعرفة؟ 
- هل تملك الإدارة الحق في إجبار الخبراء على المساهمة بخبراتهم؟ 
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الخصوصية: 

يختلف مفهوم الخصوصية باختلاف الناس. وبشكل عام فإن الخصوصية هي حقك في أن تنفرد 
cello‏ كما أنها الحق في أن تتحرر من تدخلات الآخرين غير المعقولة في أمورك الشخصية. ولطاما 
كانت الخصوصية قضية قانونية» وأخلاقية, واجتماعية في العديد من البلدان» حيث يتم الاعتراف 
بالحق في الخصوصية اليوم في كل ولاية من الولايات المتحدة الأمريكية والحكومة الفيدرالية. سواء 
أكان من خلال qa pel‏ أو بموجب القانون العام. ويمكن تفسير تعريف الخصوصية تفسيرًا واسعًا 
جدًاء بيد أن المحكمة كانت تتبع في قراراتها السابقة القاعدتين التاليتين بشكل دقيق إلى حد ماء وهما: 
-١‏ أن حق الخصوصية ليس حقًا مطلقًا. فالخصوصية يجب أن تكون متوازنة مع احتياجات المجتمع. 
'- أن حق الجمهور في المعرفة يفوق حق الفرد في الخصوصية. 

وتوضح هاتان القاعدتان سبب صعوبة تحديد وتطبيق قوانين الخصوصية في بعض الأحيان 
(انظر 2005 ,هآءه۴). وتتضمن قضايا الخصوصية عبر الإنترنت خصائص وسياسات محددة. 
وفيما يلي سنناقش أحد المجالات الذي قد تتعرض فيه الخصوصية للخطر. وللتعرف على قضايا 
الخصوصية والأمان في بيئة مستودع البيانات» يمكنك أيضًا الاطلاع على الورقة التي كتبها كل من 
LeClercs Elson‏ )2005( 


جمع المعلومات عن الأفراد: 


في كثير من الحالات كان التعقيد في عملية جمع المعلومات» وفرزهاء وحفظهاء والوصول إليها 
يدويًا في العديد من الوكالات الحكومية» بمثابة وقاية تلقائية ضد إساءة استخدام المعلومات 
الخاصة.. فقد كان الإقدام على انتهاك خصوصية أي شخص ببساطة أمرًا مكلقًاه ومرهقًاء فضلا عن 
كونه معقدًا. وقد أنشأ الإنترنت بعدًّا جديدًا تمامًا للوصول إلى البيانات واستخدامهاء جنبًا إلى جنب 
مع قواعد البيانات واسعة النطاق. ويمكن استخدام القوة الكامنة في الأنظمة التي يمكنها الوصول 
إلى كميات هائلة من البيانات لأجل مصلحة المجتمع. فمثلًاه من خلال مطابقة السجلات بمساعدة 
جهاز الحاسب يمكن القضاء على أو الحد من الاحتيال والجرهة وسوء الإدارة الحكومية والتهرب 
الضريبي والغش في الرعاية الاجتماعية وسرقة الدعم الأسري وتوظيف العمال غير الشرعيينء وغير 
ذلك. ولكن ما هو القدر الذي يجب أن يتكلفه الفرد من فقدان الخصوصية بحيث تستطيع 
الحكومة إلقاء القبض على المجرمين بشكل أفضل؟ وينطبق الأمر ذاته على مستوى الشركات. 
فعلى الرغم من أن المعلومات الخاصة بالموظفين قد تساعد في اتخاذ القرارات بشكل أفضلء إلا أن 
خصوصية الموظفين قد تتأثر بهذا الأمر. وهناك قضايا مشابهة تتعلق بالمعلومات الخاصة بالعملاء. 
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الجدير بالذكر أن الآثار المترتبة على الخصوصية على شبكة الإنترنت لا يُستهان بها. ويوسع 
القانون الوطني الأمريي أيضًا من قدرة الحكومة على الوصول إلى معلومات الطالب والمعلومات 
المالية الشخصية دون أي شبهة في ارتكاب مخالفات, وذلك عبر إثبات أن تلك المعلومات التي 
من المرجح الحصول عليها لها صلة بالتحقيق الجنافي الجاري (انظر مركز معلومات الخصوصية 
الإلكترونيةء .)۲١١١‏ فقد تم استخدام معلومات الموقع من الأجهزة لتحديد مكان الضحايا وكذلك 
الجناة في بعض الحالات» ولكن إلى أي حد تكون المعلومات ليست ملا للفرد؟ وقد جلب 
اللغط الأخير حول ما تقوم به الولايات المتحدة وغيرها من الدول الأخرى من تسجيل بيانات 
المكالىمات الهاتفية» والبريد الإلكترونيء وغيرها من التحركات المرورية الإلكترونية العديد من هذه 
القضايا إلى المقدمة. وبالإضافة إلى ذلك, فقد أدى تسريب المعلومات من الاتصالات الحكومية 
عن طريق 181116815 إلى حدوث عاصفة كبيرة على مدى السنوات القليلة الماضية. وقد أدى 
Snowden eL Las]‏ 80103104 مؤخرّاء عن برامج الحكومة الأمريكية لجمع البيانات واستخراج 
هذه المعلومات أيضًا إلى ضجة إعلامية كبيرة حول قضايا انتهاك الخصوصية. وأي بحث في هذه 
الموضوعات سوف يسفر عن الكثير من الروابط ووجهات النظر. وبصفتك محترقًا لعلم البيانات» 
فإنه ينبغي عليك أن تدرك أن مثل هذه القضايا يمكنها أن تُحدث فرقًا كبيرا في سمعة منظمتك. 

وهناك أداتان فعالتان لجمع المعلومات حول الأفراد وهما ملفات تعريف الارتباط وبرامج 
التجسس. وقد بدأت وسائل تسجيل الدخول الأحادي التي تسمح للمستخدم بالوصول إلى خدمات 
متنوعة من مُقَدم الخدمة تثير بعض نفس المخاوف مثل ملفات تعريف الارتباط. وهناك خدمات 
Yahoog Google) |] 2s‏ و31571) تطلب من المستهلكين بشكل دائم إدخال ملف تعريف 
المعلومات مع كلمة مرور واستخدام هذه المعلومات وكلمة المرور بشكل متكرر للوصول إلى 
الخدمات في مواقع متعددة. وقد ذكر النقاد أن مثل هذه الخدمات ينتج عنها نفس الفرص التي 
تنتج عن ملفات تعريف الارتباط لانتهاك خصوصية الفرد. 

وقد يؤدي استخدام تقنيات الذكاء الاصطناعي في الإدارة وتطبيق القوانين واللوائح إلى زيادة 
المخاوف العامة فيما يتعلق بخصوصية المعلومات. وهذه المخاوفء التي نتجت عن القدرات الملموسة 
للذكاء الاصطناعيء سوف تتعين معالجتها في بداية أي محاولة لتطوير الذكاء الاصطناعي تقريبًا. 

هناك العديد من المستخدمين غير مُدركين للمعلومات الشخصية التي يتم تعقبها من خلال 
استخدامهم للهواتف الذكية. وهناك العديد من التطبيقات التي تجمع بيانات الممستّخدم من 
خلال تعقب كل هاتف أثناء انتقاله من بُرجٍ خلية إلى آخرء ومن خلال أجهزة تحديد المواقع 
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والتي تنقل مواقع المُستخدمينء فضلًا عن تجميع البيانات من الهواتف التي تنقل ابمعلومات عبر 
نقاط اتصال 181-51. وعلى الرغم من زعم مطوري التطبيقات الأساسيين أنهم دقيقون للغاية 
ويعملون على حماية خصوصية المستخدمينء إلا أنه من المثير للاهتمام ملاحظة مقدار المعلومات 
المتوفرة من خلال استخدام جهاز واحد. وقد حدث جدل مؤخرًا بين كل من شركة عاممٍم 
والحكومة الأمريكية حول طلب حكومة الولايات المتحدة لإلغاء قفل الأيفون (عمهط12) ورفض 
شركة آبل القيام بتعديل برامجها من أجل تلبية هذا الطلب. حيث تزعم شركة ٠مم‏ آنها تجمع 
معلومات قليلة أو تكاد تكون معدومة حول عملائها من مُستخدمي أيفون. وعلى الجانب الآخر 
فإن 0081 يجمع الكثير من ال معلومات المفيدة حتى يتمكن من تقديم معلومات استباقية 
للمُستخدمين حول التقويم الخاص بهم. والمطاعم المْفّضلة, والأنشطة القادمة, وغيرها. كما 
ينبغي على أي مُطور تطبيق تحليلات أن يضع في اعتباره قضايا الخصوصية. 
الأمن الداخلي والخصوصية الفردية: 

على الرغم من أن الكثيرين يعتبرون أن استخدام تقنيات التحليلات مثل استخراج وتفسير 
محتوى اط مكاط ات الهاتفيةء والتق اط صور للأشخاص ف أماكن معينة وتحديدهاء واستخدام 
الماسحات الضوئية لرؤية متعلقاتك الشخصية: مثابة انتهاك للخصوصية» إلا أن العديد من الناس 
يدركون أن تلك الأدوات التحليلية هي وسيلة فعالة وذات كفاءة لزيادة الأمنء على الرغم من 
تعض خصوصية العديد من الأبرياء للانتهاك. 

وتقوم حكومة الولايات المتحدة بتطبيق تقنيات تحليلية على نطاق عامي في الحرب على 
الإرهاب. ففي العام ونصف الأول بعد أحداث الحادي عشر من سبتمبر ٠٠٠١١‏ قامت سلاسل 
محلات السوبر ماركت» ومتاجر مستلزمات تجديد المنازل» وغيرهم من تجار التجزئة بتسليم 
كميات هائلة من سجلات العملاء طوعًا إلى وكالات تنفيذ القانون الفيدراليةء منتهكة في الغالب 
سياسات الخصوصية الْعْلَتّة. وقد استجاب الكثير من الآخرين لأوامر ا محكمة في الحصول على 
معلومات. كما يقتضي القانون. وتملك حكومة الولايات المتحدة الحق في جمع بيانات الشركة 
بموجب التشريع الذي تم تمريره بعد أحداث الحادي عشر من سبتمبر Yes‏ ويقوم مكتب 
التحقيقات الفيدرالي (181) الآن باستخراج كميات هائلة من OLLI‏ بحا عن أي نشاط يمكن 
أن يشير إلى وجود مؤامرة إرهابية أو جريمة. 

الجدير بالذكر أن قضايا الخصوصية كثيرة. ونظرًا لأن الحكومة تحصل على البيانات الشخصية 
للكشف عن أنماط النشاطات المريبة» فهناك احتمال أن تُستّخدم هذه البيانات بشكل غير لائق أو 
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غير قانوني. ويرى الكثيرون أن مجرد جمع البيانات يُعد انتهاكًا لحريات وحقوق المواطنين. فهم 
يرون ضرورة وجود منظمة رقابة «للإشراف على المراقبين», للتأكد من أن وزارة الأمن الداخلي 
لاتحصل على البيانات دون داع لذلك. وبدلًا من ذلكء فإنه ينبغي الحصول على البيانات 
والمعلومات التي لها صلة وثيقة بالموضوع فقط والتي يمكن استخراجها لتحديد الأنماط التي يمكن 
أن تؤدي لوقف أنشطة الإرهابيين» وهذه ليست بالمهمة السهلة. 


قضايا تقنية حديثة في الخصوصية والتحليلات: 


يعتمد أكثر مقدمي خدمات الإنترنت مثل Twitters .Facebooks Google‏ وغيرها على 
تحقيق الدخل من إجراءات ا مستخدمين. فهم يفعلون ذلك بطرق مختلفة, غير أن كل هذه 
الأماليب في النهاية تصل إلى ملف تعريف الدُستَخدم أو تفضيلاته اعتمادًا على استخدامه. ومع 
تزايد مُستخدمي الإنترنت بوجه عام ومُستخدمي الأجهزة المحمولة بوجه خاصء تم تأسيس 
العديد من الشركات لاستخدام التحليلات المتقدمة لتطوير ملفات تعريف المستخدمين اعتمادًا 
على استخدام الأجهزة والحركةء وجهات الاتصال الخاصة بال ممستخدمين. وتحتوي مجلة Wall‏ 
le Street‏ مجموعة ممتازة من ال مقالات تحت عنوان )2016 (WallStreetJournal.com,‏ 
.«What They Know»‏ ويتم تحديث هذه المقالات باستمرار لتسليط الضوء على أحدث 
التقنيات وقضايا الخصوصية / الأخلاقية. وقد شملت إحدى الشركات المذكورة في هذه السلسلة 
(Towerdata (ya «52 oS! (29) Rapleaf‏ وتدّعي تقنية 1م22 أنها قادرة على توفير ملف 
تعريف المُسْتَخْدِمِ بمجرد معرفة عنوان البريد الإلكتروني الخاص به. ومن الواضح أن تقنيتهم 
مكنم من جمع معلومات مهمة. وهناك شركة أخرى تهدف إلى تحديد الأجهزة على أساس 
استخدامها وهي شركة -BlueCava‏ والتي اتحدت مؤخرًا مع شركة -(Qualia.com) Qualia‏ 
وتقوم تقنية 8101603978 الخاصة بشركة 8113© بإرفاق ملف شخمي لتتمكن من التعرف على 
المُستّخدم باعتباره فرداً واحداً أو عائلة على الرغم من أنهم قد يستخدمون العديد من التليفونات 
ا محمولة وأجهزة الحاسب المحمولة. وتقوم كل هذه الشركات بتوظيف التقنيات مثل التجميع 
واستخراج الارتباط لتطوير ملفات تعريف الس تَخدمين. ومن المؤكد أن مثل هذه التطبيقات 
التحليلية تثير أسئلة شائكة حول انتهاك خصوصية المْسْتَخدمين. وبالطبع» فإن العديد من 
الشركات التحليلية حديثة الظهور في هذا المجال تَدَّعي احترام خصوصية المُسْتَخدمء بيد أنه كثير؟ 
ما يتم الإبلاغ عن حدوث انتهاكات. فمثلاء 5s) Rapleaf à 5,5 cal‏ أشرنا il‏ أنها متحدة 
الآن مع ٥w e۵۵4‏ ۲) تجمع معلومات غير مُصَرّح بها eL‏ من مستخدمي Facebook‏ 
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وتم حظرها لاحقًا Joel Stein (2011) eà; Time ále« (3 55 ale. „SS 285 .Facebook ġa‏ 
أنه بعد مرور ساعة من إعطاء عنوان بريده الإلكتروني إلى شركة متخصصة في مراقبة معلومات 
(reputation.com) eae Ll‏ تمكنوا بالفعل من اكتشاف رقم الضمان الاجتماعي الخاص 
به ويّعد هذا الرقم مفتاحًا للوصول إلى معلومات خاصة عن المُستخدم وقد يؤدي إلى سرقة 
الهوية. ولذا؛ فإنه ينشأ عن انتهاكات الخصوصية مخاوف من السلوك الإجرامي الذي يستند إلى 
معلومات المُستخدمء وهذا المجال يُعد مصدر قلق كبير ويحتاج إلى دراسة متأنية. وسيقوم موقع 
الويب الخاص بهذا الكتاب بتحديث التطورات الجديدة. ويعد موقع مجلة «What They‏ 
Wall Street‏ «Kn0wمصدرًا‏ ينېغي الرجوع إليه بشكل دوري. وهذه الأمثلة لا توضح فقط قوة 
التحليلات في التمكن من معرفة المزيد حول العملاء الممستهدفين, بل إنها أيضًا تعمل مثابة تحذير 
لمحترفي التحليلات بشأن كونها حساسة تجاه الخصوصية والقضايا الأخلاقية. 

وهناك مجال تطبيق آخر يجمع بين تأثير تقنية المعلومات التنظيمية: والبيانات الضخمة, 
وأجهزة الاستشعارء والاهتمامات المتعلقة بالخصوصية يقوم بتحليل سلوكيات الموظف معتمدًا 
على البيانات التي يتم جمعها من أجهزة الاستشعار التي يرتديها الموظفون في الشارة. وهناك 
شركة واحدة, وهي Humanyze‏ 55 أن العديد من هذه التطبيقات هي جزء لا يتجزأ من 
أجهزة الاستشعار التي يرتديها الموظفون. وتقوم هذه المستشعرات بتعقب كل تحركات الموظف. 
وبطبيعة الحالء فإنه ينشأ عن ذلك قضايا خصوصية كبيرة. فهل يجب أن تكون الشركات قادرة 
على رصد تحركات موظفيها بهذا التدخل؟ وقد أفادت #6تإصهددناة؟ أن تحليلاتها تقدم تقريرًا على 
أساس إجمالي عملائها فقطء فلا تتم مشاركة بيانات المُستخدم الفردية. وقد لاحظوا أن بعض 
أصحاب العمل يرغبون في الحصول على بيانات فردية للموظفين, بيد أن عَفُدهم يمنع هذا النوع 
من المشاركة بشكل واضح. وعلى أي حالء فإن أجهزة الاستشعار تؤدي إلى مستوى آخر من المراقبة 
والتحليلات» الأمر الذي يفرض أسئلة مثيرة للاهتمام تتعلق بالخصوصية. والقوانين» والأخلاق. 


من يمتلك بياناتنا الخاصة؟ 


مع النمو الأخير للبيانات حسب استخدامنا للتقنية وقدرة الشركات على الوصول إليها 
واستخراجهاء فإن النقاش المتعلق بالخصوصية يؤدي أيضًا إلى السؤال الواضح حول لمن تكون ملكية 
بيانات المستخدم. وقد سلط ج1861 )7١17(‏ الضوء Bloomberg 2545 i$ All o3 (de‏ 
Ya ello -Businessweek‏ على سيارة جديدة نسبيًاء حيث تم تجهيز السيارة بالعديد من 
أجهزة الاستشعار بدءًا بأجهزة استشعار ضغط الإطارات وصولًا إلى أجهزة تتبّع الموقع 625 والتي 
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يمكنها تتبع المكان الذي تذهب إليه. ومدى السرعة التي تقود بهاء ومتى قمت بتغيير الطرقء وغير 
ذلك. وقد تعرف السيارة حتى وزن الراكب الذي انضم إلى المقعد الأمامي. وكما يشير Welch‏ فإن 
السيارة المتصلة بالإنترنت (وهذا حال معظم السيارات الجديدة) قد تكون كابوسًا خاضًا لمالكها أو 
”منجم ذهب“ بيانات لمن يستطيع امتلاك هذه البيانات. وهناك معركة كبيرة محتدمة بين شركات 
صناعة السيارات ومقدمي التقنية مثل: عأمجف (Android Auto) Google «(Car Play)‏ 
على من يمتلك هذه البيانات ومن الذي يمكنه الوصول إليها. وهذا الأمر أصبح أكثر أهمية لأن 
السيارات أصبحت ذاتية القيادة بشكل أكبرء ومن الممكن أن يكون السائق / الراكب في السيارة 
عميلًا مستقبليًا مستهدفًا بشكل كبير لمنتجات وخدمات محددة ومعروفة بشكل جيد للمنظمة 
القادرة على إنشاء ذلك املف الشخصي. فعلى سبيل المثالء يجمع تطبيق Google's Waze‏ 
بيانات نظام تحديد الموقع للمُستخدم ا يزيد عن 0٠0‏ مليون مُستخدم لتتبع معلومات الحركة 
المرورية ومساعدة المستخدمين في العثور على أفضل مسارء ولكن عندئذ تُعرض الإعلانات المنبثقة 
على شاشات المستخدمين. ومن الجدير بالذكر أن تطبيقات ماهلا وتإكناهم5 والتطبيقات الأخرى 
شائعة الاستخدام في السيارة لها نفس الخطط والتطبيقات. 

وهناك معركة أخرى مشابهة محتدمة حول صحة المستخدمين وبيانات القياس الحيوي. وبسبب 
المخاوف الأمنية» فإن العديد من المستخدمين يتحولون إلى تسجيل الدخول الحيوي للتحقق من 
الشخصية باستخدام بصمات الأصابع» وشاشات اللمسء وغير ذلك. ونظرًا لأن هذه المعلومات ينفرد 
بها الفرد دون غيره بشكل كبيرء فقد يصبح التنميط المستقباي للمستخدم أكثر دقة. وبالتاي فإن 
معركة امتلاك هذه المعلومات وربطها ببيانات أخرى تم جمعها تتزايد هي الأخرى. وبالمثل» فإن 
المستشفيات والأخصائيين الطبيين والمختبرات وشركات التأمين تجمع الكثير من المعلومات حول 
تاريخنا الطبي. وعلى الرغم من وجود قوانين صارمة في الولايات المتحدة (مثل: ۲11۶۸۸) لحماية 
خصوصية المستخدم. إلا أن تجميع مثل هذه المعلومات يطلق العنان للتقدم الكبير في التحليلات 
الصحية. ومع ذلك فإن التحدي المتعلق بالخصوصية: لايزال حقيقيًا للغاية. 

ولكي تكون خبيرا في تحليل البيانات» فإن الحد الأدنى لذلكء أن تكون مدركًا تمامًا للقضايا القانونية 
والأخلاقية التي ينطوي عليها جمع المعلومات التي قد تكون خاصة أو محمية. وهناك سؤال عام 
لتطرحه على نفسك وهو: هل ترغب في تضمين معلوماتك الخاصة في التطبيق الذي تفكر فيه؟ 
الأخلاق في اتخاذ ودعم القرار: 

وينقلنا السؤال الأخير إلى العديد من القضايا الأخلاقية المرتبطة بالتحليلات. وتتضمن القضايا 
الأخلاقية التي قد تمثل أهمية في تنفيذ التحليلات ما يلي: 
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- المراقبة الإلكترونية. 
- الأخلاق à‏ تصميم أنظمة دعم القرار (انظر «Cagle g Courtneys Paradiceg «Chae‏ 2005( 
- سرقة البرمجيات. 
- انتهاك خصوصية الأفراد. 
- استخدام قواعد بيانات الملكية. 
- استخدام الملكية الفكرية مثل المعرفة والخبرة. 
- تعرض اللوظفين لبيئات غير آمنة مرتبطة بأجهزة الحاسب. 
- إمكانية وصول العاملين غير المصرح لهم إلى جهاز الحاسب. 
- دقة البيانات» والمعلومات. والمعرفة. 
- حماية حقوق المستخدمين. 
- سهولة الوصول إلى المعلومات. 
- استخدام أجهزة حاسب الشركة لأغراض ليس لها علاقة بالعمل. 
- مقدار تفويض أجهزة الحاسب في اتخاذ القرار. 

تشكل القيم الشخصية عاملًا مهما في قضية اتخاذ القرارات الأخلاقية. وتعتبر دراسة القضايا 
الأخلاقية معقدة نظرًا لأنها متعددة الأبعاد. لذلك؛ فمن المنطقي أن تتطور الأطر لوصف 
العمليات الأخلاقية والنظم. .335 «Mason (yo JS o‏ مهصا0 (1995) كيف توسع التقنية 
والابتكار من حجم مجال الأخلاقيات وكيف تناقش نموذجًا للتفكير الأخلاقي ينطوي على أربعة 
أسئلة أساسية للتركين وهي: 
-١‏ من هو الوكيل؟ 
la -Y‏ هو الإجراء الذي اتخذ بالفعل أو يجري التفكير فيه؟ 
*- ما هي نتائج أو عواقب الفعل؟ 
-٤‏ هل النتيجة عادلة أم أنها فقط لجميع أصحاب المصلحة؟ 

كما وصفوا التسلسل الهرمي للتفكير الأخلاقي الذي يستند فيه كل حكم أو عمل أخلاقي إلى 
قواعد وقوانين الأخلاق. والتي تقوم على المبادئ التي تستند بدورها على نظرية أخلاقية. 

هناك قصة واحدة هي التي جعلت العديد من المستخدمين مستائين (على الرغم من أنها 
م تكن غير قانونية). فقد كانت تجربة ال Facebook‏ هي إحدى تجارب الماضي وكانت هذه 
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التجربة لتقديم الأخبار المختلفة للمستخدمين ومراقبة ردود أفعالهم العاطفية والتي كانت تقاس 
من خلال الردودء والإعجابات» وتحليل oe Lil‏ وغير ذلك (وعلى سبيل Goel „hh JEL‏ 2014). 
وتعمل معظم الشركاتء بما في ذلك شركات التقنية على تشغيل اختبار الممستخدم لتحديد الميزات 
التي تحظى بميول الكثيرين إليها أو التي تكون غير مُحبّبة ومن ثم تقوم الشركات بتعديل عروض 
منتجاتها. ونظرًا لأن ال 752650016 كبير للغاية» فإن أمر تشغيل هذه التجربة بدون الموافقة 
المسبقة للمستخدمين يُعد أمرًا غير أخلاقي. وفي الواقع» فقد اعترف 12060001 بخطئه ومن ثم 
أعدت المزيد من ال مراجعة الرسمية من خلال لوحات المراجعة الداخلية وآليات الامتثال الأخرى 
للاختبار في المستقبل. وعلى الرغم من أنهم واجهوا الكثير من الصحف السيئة في البداية» إلا أن 
ردهم في الوقت المناسب سمح لهم باستعادة مكانتهم سريعًا. 
أسئلة مراجعة على القسم 0-۸: 
-١‏ اذكر بعض القضايا القانونية الخاصة بالتحليلات. 
؟- قم بوصف المخاوف المتعلقة بالخصوصية في التحليلات. 
da -Y‏ وجهة نظرك» من الذي ينبغي أن تلك البيانات المتعلقة باستخدامك للسيارة؟ 
-٤‏ اذكر القضايا الأخلاقية في التحليلات. 
۸ آثار التحليلات فى المنظمات: نظرة عامة: 
تُعد الأنظمة التحليلية عوامل مهمة في ثورة المعلومات وابمعرفة liag‏ تحول ثقافي يلتقي فيه 
معظم الناس الآن فقط للتوصل إلى بنود. وعلى العكس من الثورات البطيئة التي كانت تحدث 
في الماضيء مثل الثورة الصناعيةء فإن هذه الثورة تحدث بسرعة كبيرة وتؤثر على كل جانب من 
جوانب حياتنا. ويلازم هذا التحول السريع مجموعة من القضايا الإدارية والاقتصادية والاجتماعية. 
إن فصل أثر التحليلات عن تلك التأثيرات الخاصة بالأنظمة الأخرى اللحوسبة لهي مهمة صعبة, 
لا سيما بسبب الاتجاه نحو الدمج» أو حتى التضمينء والتحليلات مع أنظمة المعلومات الأخرى التي 
تعتمد على الحاسب. ويمكن للتحليلات أن يكون لها آثار دقيقة وآثار جسيمة على حد سواء. فهذه 
الأنظمة يمكنها أن تؤثر على الأفراد والوظائف, بالإضافة إلى أنها يمكنها التأثير أيضّا على هياكل عمل 
الإدارات والوحدات داخل المنظمة. كما يمكن أن يكون لها أيضًا تأثيرات كبيرة على المدى الطويل 
على الهياكل التنظيمية الإجمالية» والصناعات بأكملهاء والمجموعات, والمجتمع ككل (أي: أثر كلي). 
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وسوف يكون للنمو المفاجئ في التحليلات» والذكاء الاصطناعيء والحوس بة المعرفية أثر كبير 
على مستقبل المنظمات. ويمكن تقسيم أثر أجهزة الحاسب والتحليلات إلى ثلاث فئات عامة: 
تنظيمية» وفردية» ومجتمعية. وقد كان لأجهزة الحاسب العديد من التأثيرات في كل فئة من هذه 
الفئات. ولا يمكننا النظر في جميع هذه الأمور في هذا القسم. لذا؛ فإننا سوف نتطرق في الفقرات 
التالية إلى الموضوعات التي نرى أنها أكثر صلة بالتحليلات. ويوضح الشكل (8-/) الموضوعات 
العامة التي نخطط لتغطيتها. 














شكل ۷-۸: آثر التحليلات على المنظمات 
وحدات تنظيمية جديدة: 


ويتمثل أحد التغييرات في الهيكل التنظيمي في إمكانية إنشاء قسم للتحليلات» أو قسم ذكاء 
الأعمال. أو قسم علم البيانات الذي تلعب فيه التحليلات دورًا رئيسًا. وهذه الوحدة الخاصة 
يمكن دمجها مع وحدة التحليل الكمي أو استبدالها أو يمكن أن تكون كيانًا جديدًا تمامًا. وبعض 
الشركات الكبيرة لديها وحدات أو إدارات منفصلة لدعم القرار. فعلى سبيل اللثال» فإن العديد 
من البنوك الكبرى لديها مثل هذه الإدارات في أقسام الخدمات امالية الخاصة بها. كما أن العديد 
من الشركات لديها وحدات صغيرة من علم البيانات أو ذكاء الأعمال / مستودع البيانات. oleg‏ ما 
تشارك هذه الأنواع من الإدارات في التدريب بالإضافة إلى أنشطة تطوير الاستشارات والتطبيقات. 
وهناك شركات أخرى فوّضت أحد كبار مسؤولي التقنية ليكون مس ؤولًا عن ذكاء الأعمال. وعن 
الأنظمة الذكيةء بالإضافة إلى تطبي قات التجارة الإلكترونية. وهناك شركات مثل شركة غأمع:ة]” 
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وشركة 187310364 لديها استثمارات كبيرة في مثل هذه الوحدات» والتي تعمل باستمرار على تحليل 
بياناتها لتحديد كفاءة التسويق وإدارة التوريد من خلال فهم تفاعلات كل من العملاء والموردين. 
وعلى الجانب الآخر فإن هناك شركات عديدة تقوم بدمج تخصصات علم التحليلات / البيانات 
داخل المجالات الوظيفية مثل التسويقء والتمويل» والعمليات. وبشكل عام فإن هذا المجال 
هو أحد المجالات التي يوجد بها فرص عمل كبيرة حاليًا. وقد حددنا في الفصل الأول عناوين 
الوظائف التي لها صلة بهذا الموضوع Gle Éag psiu lS‏ لعالم البيانات المثالي في القسم التالي. 
وقد أدى نمو صناعة ذكاء الأعمال إلى تكوين وحدات جديدة داخل الشركات التي تقدم خدمات 
تقنية المعلومات أيضًا. فعلى سبيل «JEU‏ قامت 181 قبل بضع سنوات» بتشكيل وحدة أعمال 
جديدة تركز على التحليلات. وقد تضمنت هذه المجموعة وحدات في ذكاء الأعمالء ونماذج 
الأمثلية» والتنقيب ف البيانات» وأداء الأعمال. والأهم من ذلكء هو أن المجموعة لا تركز فقط 
على البرمجيات» بل إنها تركز بشكل أكبر على الخدمات / الاستشارات. وكما هو مُلاحظ في الأقسام 
السابقةء فإن النمو الهائل في صناعة التطبيقات قد أنشأ العديد من الفرص للشركات الجديدة التي 
يمكنها توظيف التحليلات وتقديم تطبيقات مبتكرة في أي مجال محدد. كما لاحظنا فيما سبق 
كيف تقوم الشركات الصناعية التقليدية في العصر الصناعي مثل شركة åS àg General Electric‏ 
5 بإعادة تأهيل نفسها لتوليد عائدات كبيرة من تقديم خدمات التحليلات التي لها صلة 
بمنتجاتها وخدماتها. وهذا من شأنه أن يغير هيكل السلطة التنظيمية؛ نظرًا لأن هيكل القوة 
التنظيمية عادةً ما يُشتق من المكان الذي يتم فيه إنشاء معظم الدخل. 


إعادة تصميم المُنظمة من خلال استخدام التحليلات: 


يقوم مجال بحثي وعملي حديث الظهور بتوظيف تقنيات علم البيانات لدراسة الديناميكيات 
التنظيميةء وسلوك الأفراد. وإعادة تصميم المنظمة لتحقيق أهدافها بشكل أفضل. وتُعرف 
تطبيقات هذه التحليلات في الواقع باسم «تحليلات الأشخاص». فعلى سبيل المثالء تُستَخدّم 
التحليلات من قبل إدارة الموارد البشرية لتحديد المُرشحين المثاليين من التجمع الذي يُقدم سير 
ذاتية لامنظمة» أو حتى من خلال تجمُع أوسع مثل ۵1١‏ )م11. وقد تم تطوير التطبيقات 
لتحديد أفضل المرشحين الذين لا يحتمل مغادرتهم للمنظمة. فالإبقاء على الموظف يشبه الإبقاء 
على العميلء ولذلكء فإن تقليل ”الحركة“ داخليًا لهو أمر مهم بنفس القدر لنجاح المنظمة. 

ويتعلق مجال التطبيق الحديث والأكثر إثارة بفهم سلوك الموظفين من خلال مراقبة تحركاتهم 
داخل المنظمة واستخدام تلك المعلومات لإعادة تصميم التخطيط أو لإعادة تشكيل الفرق لتحقيق 
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أداء أفضل. وهناك شركة Humanyze yas‏ (كانت معروفة سابقًا Sociometric Solutions eb‏ 
وذكرّت في القسم )٥-۸‏ لدیها شارات تتضمن نظام تحديد المواقع 6755 وجهاز استشعار. وعند 
ارتداء الموظفين لهذه الشاراتء يتم تسجيل جميع تحركاتهم. وحسبما وَرَّد فقد تمكنت شركة 
12 من مساعدة الشركات في التنبؤ بأي نوع من الموظفين من ارجح بقاؤه بالشركة أو 
مغادرتها على أساس تفاعلات هؤلاء الموظفين مع غيرهم من الموظفين الآخرين. فعلى سبيل المثاله 
الموظفون الذين يبقون في مقصوراتهم الخاصة تكون فرصة ترقيهم في سلم الشركات أقل بكثير 
من الموظفين الذين يتنقلون ويتفاعلون مع غيرهم من الموظفين الآخرين على نطاق واسع. وقد 
ساعد جمع وتحليل البيانات المتشابهة شركات أخرى على تحديد حجم قاعات المؤتمرات المطلوبة 
أو حتى تصميم المكتب لتحقيق أقصى قدر ممكن من الكفاءة. ووفقًا ما ورد بموقع Humanyze‏ 
على الإنترنت» فقد أرادت إحدى الشركات فهم خصائص قادتها بشكل أفضل. ومن خلال تحليل 
البيانات من تلك الشارات» تمكنت الشركة من إدراك أن القادة الناجحين لديهم بالفعل شبكات 
أكبر يتفاعلون معهاء كما أنهم يقضون وقثًا أطول في التفاعل مع الآخرينء فضلًا عن أنهم يتمتعون 
بالنشاط البدني. وقد استُخْدِمَت المعلومات التي جُمِعَت من جانب قادة الفرّق لإعادة تصميم 
مساحة العمل والمساعدة في تحسين أداء القادة الآخرين. ومن الواضح أن هذا يؤدي إلى قضايا 
تتعلق بالخصوصيةء غير أن مثل هذه الدراسات قد تكون قابلة للتطبيق داخل المنظمة. ويحتوي 
موقع 5115281226 على العديد من دراسات الحالة المثيرة للاهتمام والتي تقدم أمثلة على كيفية 
استخدام تقنيات البيانات الضخمة لتطوير هياكل فريق أكثر كفاءة وتصميم تنظيمي. 


أثر التحليلات على أنشطة المديرين» وأدائهم» ورضاهم الوظيفي: 


على الرغم من أن العديد من الوظائف قد تتمتع بثراء كبير في جانب التحليلات» إلا أن هناك 
وظائف أخرى قد تصبح أكثر رتابة وأقل إرضاء. فعلى سبيل المثالء قبل أكثر من ٠غ‏ عامًاء تنبا 
كترود (1971) بأن أنظمة المعلومات التي تعتمد على الحاسب من شأنها أن تقلل من السلطة 
التقديرية الإدارية في عملية اتخاذ القرار وهذا يؤدي إلى عدم رضا المديرين. ومع ذلك فقد وجد كل 
من Davenport‏ و Harris‏ (2005) فی دراستھم لنظم القرار الآلی أن الموظفين الذين يستخدمون 
هذه الأنظمةء وخصوصًا من يتم تمكينهم بواسطة الأنظمة» كانوا أكثر رصا عن وظائفهم. وإذا 
أمكن أداء العمل الروتيني والعمل البسيط باستخدام نظام تحليليء فإنه يجب تهيئة المديرين 
والعاملين في مجال المعرفة لمواجهة المزيد من التحديات. ويعد أهم عمل يقوم به المديرون هو 
اتخاذ القرارات. وتستطيع التحليلات أن تغير الطريقة التي يتم بها اتخاذ العديد من القرارات» 
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وبالتالي فإنه يمكن تغيير مسؤوليات الوظائف الخاصة با مديرين. وعلى سبيل المثال» فقد وجد 
«Maguiragas «Plaisents Perez-Cascante ùj Js‏ بالإضافة إلى 4تهصء8 (2002) أن نظام 
دعم القرار قد استطاع تحسين أداء كل من المديرين الحاليين والمديرين الجدد فضلًا عن الموظفين 
الآخرين. فقد ساعد المديرين على اكتساب المزيد من المعارف والتجاربء والخبرة وبالتالي تعزيز 
جودة صنع القرار. وقد أعلن العديد من المديرين أن أجهزة الحاسب قد منحتهم أخيرًا الوقت 
للخروج من المكتب والتواجد في الساحة. كما وجدوا أيضًا أن بإمكانهم قضاء المزيد من الوقت في 
التخطيط للأنشطة Vas‏ من إضاعة الوقت في حل المشاكل حيث إنه من الممكن تنبيههم للمشاكل 
المحتملة في وقت مبكر وذلك بفضل العوامل الذكية وغيرها من الأدوات التحليلية. 


ويكمن الجانب الآخر من التحدي الإداري في قدرة التحليلات على دعم عملية صنع القرار 
ele Sis‏ بالإضافة إلى قدرتها على التخطيط الإستراتيجي والتحكم في القرارات بشكل خاص. 
حيث هكن للتحليلات أن تغير عملية صنع الق رار بل يمكنها تغيير أنماط اتخاخذ القرار. فعلى 
سبيل المثال» يتم الانتهاء من جمع اب معلومات من أجل صنع القرار بسرعة أكبر في حالة استخدام 
التحليلات. وتعد تُظم معلومات ال مؤسسة مفيدة للغاية في دعم الإدارة الإستراتيجية. وتُستخدم 
الآن تقنيات التنقيب في البيانات والنص والويب لتحسين المسح البيئي الخارجي للمعلومات. 
ونتيجة لذلك؛ يستطيع المديرون تغيير نهجهم لحل المشاكل وتحسين قراراتهم بسرعة. ويقال إن 
ستاربكس قامت مؤخرًا بتقديم مشروب قهوة جديد. واتخذت قرارها بش أن التسعير من خلال 
تجربة عدة أسعار مختلفة ورصد ردود الفعل على وسائل التواصل الاجتماعي على مدار اليوم» 
وهذا يعني أن أساليب جمع البيانات لأحد المديرين قد تختلف الآن بشكل كبير عما كانت عليه 
في الماضي. وتشير الأبحاث إلى أن معظم المديرين بميلون إلى العمل على عدد كبير من المشاكل 
في وقت واحدء متنقلين من مشكلة إلى أخرى كأنما ينتظرون المزيد من المعلومات عن مشكلتهم 
الحالية Ghoshalg Quinn .«Lampels Mintzberg 63I)‏ 2002). وتقوم تقنیات التحلیلات 
بتقليل الوقت المطلوب لإتمام المهام في عملية اتخاذ القرار كما أنها تقضي على بعض فترات الانتظار 
التي تعطل الإنتاج وذلك من خلال توفير المعرفة والمعلومات. وبالتاليء يعمل المديرون على عدد 
أقل من المهام خلال كل يوم غير أنهم يكملون المزيد منها. وقد يكون تقليل وقت البدء المرتبط 
بالانتقال من مهمة إلى أخرى هو أهم مصدر لزيادة الإنتاجية الإدارية. 

وقد يكون من بين الآثار المحتملة الأخرى للتحليلات على وظيفة المدير هو التغيير في متطلبات 
القيادة. والتي تعتبر الآن من الصفات القيادية الجيدة بشكل عام والتي قد تكون تغيرت بشكل 
كبير من خلال استخدام التحليلات. فمثله يُستبدل التواصل وجهًا لوجه بشكل متكرر بالبريد 
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الإلكترونيء ومواقع الويكيء والؤتمرات المحوسبة؛ وبالتالي فإن الصفات القيادية التي ترجع إلى 
المظهر الخارجي من الممكن أن تصبح أقل أهمية. 
وفيما يلي بعض الآثار المحتملة للتحليلات على وظائف المديرين: 
- تتطلب عملية اتخاذ العديد من القرارات خبرة (تجربة) أقل. 
- يمكن اتخاذ القرار بشكل أسرع بسبب توافر المعلومات وجعل بعض مراحل اتخاذ القرار آلية. 
- يتطلب توفير الدعم لكبار المسؤولين التنفيذيين اعتمادًا أقل على الخبراء وا محللين؛ ويس تطيع 
المديرون فعل ذلك بأنفسهم بمساعدة الأنظمة الذكية. 
- تنم إعادة توزيع الطاقة بين المديرين. (كلما زادت قدرة المعلومات والتحليل التي تلكونهاء 
زادت القوة لديهم). 
- دعم القرارات المعقدة يجعلها أسرع في التطورء كما أنها ستكون ذات جودة أفضل. 
- يتم التعجيل با معلومات المطلوبة لاتخاذ القرارات عالية المستوى أو حتى يتم إنشاؤها ذاتيًا. 
- قد تؤدي الآلية في القرارات الروتينية أو في مراحل عملية اتخاذ القرار (مثلء اتخاذ القرارات عبر 
الخطوط الأمامية واستخدام I (ADS‏ إلغاء بعض المديرين. 
وبشكل عام» تبين أن وظيفة المديرين المتوسطين هي الوظيفة الأكثر عرضةً لأن تكون آلية. 
حيث يقوم مديرو اللمستوى المتوسط باتخاذ قرارات روتينية إلى da ao‏ والتي يمكن جعلها آلية 
بالكامل. وبالنسبة لمديري ال مستويات الدنيا فإنهم لا يقضون الكثير من الوقت في اتخاذ القرار. 
فهم بدلا من ذلكء يقومون بالإشراف على غير المديرين» ويديرونهم, ويحفزونهم. وقد تكون 
بعض قراراتهم الروتينية آلية مثل الجدولة؛ أما القرارات الأخرى التي تنطوي على جوانب سلوكية 
فلا يمكن جعلها آلية. وعلى أي حالء فإننا حتى لوقمنا بجعل دورهم الأسامي آليّا بشكل كامل, 
فإننا لن نتمكن من جعل وظائفهم آلية. ويوفر الويب فرصة لجعل مهام معينة لمموظفي الخطوط 
الأمامية آلية؛ وبالتالي فإن ذلك يؤدي إلى خفض عبء العمل على المديرين المخولين بالموافقة. أما 
وظيفة كبار المديرين فهي أقل روتينية» lale casas Modos‏ عملية آلية. 
إعادة الهيكلة الصناعية: 
بدأ عدد قليل من المؤلفين بالتكهن بأثر الذكاء الاصطناعي» والتحليلات» والحوس بة الإدراكية على 
مستقبل الصناعة. وهناك القليل من المصادر الحديثة الممتازة التي يمكن مراجعتها وهي (2016) 
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(Ihe Economist) خاص من قبل ذي إيكونوميست‎ 2 33s Ransbothams (2016) Autor 
gò mä 455552016) McAfee; Brynjolfsson (a JS 4 5 xU 5$5 (Standage, 2016) 
تقريرًا شاملا إلى حد كبير, كما أنه ينظر في العديد من الأبعاد لتأثير‎ The Economist ci 253552] 
التطورات الحالية على الصناعة وا مجتمع. وتتمثل الأسباب الرئيسة في أن التقنية تكن أجهزة الحاسب‎ 
الآن من القيام بالمزيد والمزيد من المهام التي قام بها البشر. وهذا بالطبعء حدث من قبلء في الثورة‎ 
الصناعية. وما يجعل التغيير هذه المرة أكثر أهمية بكثير هو أن التقنية تمَكُن الآلات من القيام بالعديد‎ 
من المهام المعرفية. كما أن سرعة التغيير جذرية إلى الحد الذي يدعو إلى التنبؤ بأن الأثر المحتمل على‎ 
المنظمات والمجتمع سيكون مهمًا للغاية» وفي بعض الأحيان لا يمكن التنبؤ به. وبالطبع فإن هؤلاء‎ 
المؤلفين لا يتفقون في تنبؤاتهم. وفي هذه الفقرة دعونا نركز على الآثار التنظيمية أولًا. حيث يناقش‎ 
الإدراكية ستحول العديد من الوظائف التي يقوم بها البشر ليتم‎ used of Q016) Ransbotham 
القيام بها بواسطة أجهزة الحاسبء مما يترتب عليه تقليل تكاليف المنظمات. كما أن جودة ا مخرجات‎ 
قد تزيد أيضًا في العمل المعرفي» والتي ظهرت في العديد من الدراسات التي تقارن أداء الإنسان بأداء‎ 
نظام عاع600 الفائز في لعبة‎ وÎ‎ Jeopardy à IBM Watson js à; لآلة. فالجميع على علم تام‎ 
ضد الأبطال البشريين. غير أن العديد من الدراسات الأخرى في مجالات محددة مثل التعرف على‎ 60 
الكلام وتفسير الصور الطبية قد أظهرت تفوقًا مماثلًا للنظام الآلي في حالة ما إذا كانت المهمة عالية‎ 
dis التخصص ولكنها روتينية أو متكررة. أيضّاء فإنه نظرًا للاتجاه نحو توفير الأجهزة في جميع الأوقات‎ 
جميع ابمواقع» فإن ذلك قد يزيد من اتساع المنظمةء مما يؤدي إلى سهولة التدرج وبالتالي منافسة أكبر‎ 
بين المنظمات. وهذه الآثار التنظيمية تعني أن المنظمات التي كانت بارزة بالأمس من الوارد ألا تظل‎ 
في المقدمة إلى الأبد. لأن الحوسبة الإدراكية والآلية يمكنها تحدي اللاعبين الراسخة أقدامهم. وهذا هو‎ 
الحال أيضًا في صناعة السيارات. وعلى الرغم من محاولة شركات السيارات التقليدية اللحاق بالركب‎ 
وشركات التقنية الأخرى تعمل على تعطيل هيكل‎ Teslas Google oa JS بسرعة. إلا أن شركات‎ 
الصناعة من خلال تحدي قادة عصر السيارات. وتقوم التحليلات بتمكين العديد من هذه التغييرات.‎ 





أثر الأتمتة على الوظائف: 

كما تناقش التقارير البحثية التي سبق أن حددناها في الفقرة السابقة أيضًا تأثير التقدم في 
علم البيانات والذكاء الاصطناعي على الوظائف البشرية. وكما أوضحنا سابقاء فإن العديد من 
مهام العاملين في مجال المعرفة يمكن الآن تنفيذها آليًّا. وفي الوقت ذاته. فإن التقنية لا تؤدي 
JI Lilo‏ تقليل عدد الأشخاص الذين يتم توظيفهم. فكما لاحظ مماندة (2016). فقد تضاعف 
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عدد ماكينات الصرف الآلي (/8:123) أربعة أضعاف من حوالي ٠٠١٠٠١‏ إلى 0٠.٠٠١‏ في الفترة بين 
عامي 1990 و١٠70‏ إلا أن عدد موظفي البنوك قد زاد في نفس الوقت من حوالي نصف مليون 
موظف في عام 1940 إلى حوالي 000.٠٠٠‏ موظف في عام .70٠١‏ فما حدث هو أن الجزء الروتيني 
من العمل أصبح يتم عن طريق أجهزة الصرف الآلي (/8:12). أما موظفو البنك فقد أصبحوا على 
اتصال أفضل بالعملاء كما أصبحوا يركزون الآن على خدمات البيع. وبالطبع؛ فإن بعض هذه 
الخدمات يمكن أيضًا تقديمها من خلال نماذج التحليلات التي تحدد العملاء المناسبين للحصول على 
فرصة محددة. وقد قدم (2016) دسمهطاهوطوصة8 مثالًا آخر. وعادةً ما تعتبر الاستشارات امالية 
مهمة تعتمد على المعرفة. ونظرًا لأن تقنية علم البيانات توفر دعمًا مخصصًا لسيناريو محدد. فإن 
تكاليف هذه الخدمات سوف تنخفض. وهذا سيؤدي إلى تزايد الأشخاص الذين يختارون المطالبة 
Jig‏ هذه الخدمات. مما سيؤدي في النهاية إلى الحاجة لوجود المزيد من البشر للعمل المتقدم. 


ويدعي بعض هؤلاء المؤلفين بأن الأتمتة التي ترجع إلى الحوس بة المعرفية والذكاء الاصطناعي 
سوف تسرع ما يسمى ب «الاستقطاب» لسوق العمل في المستقبل. وهذا يتبعه نمو كبير في 
الوظائف في المستويات العليا والدنيا من سوق العمل غير أن الخسائر تكون في الوسط. وتستمر 
الوظائف التي تتطلب مهارات منخفضة كخدمات الحراسة» والرعاية الشخصيةء وإعداد الطعام 
وما إلى ذلك في النمو. وبالمثل» فإن الوظائف التي تتطلب مستويات مهارة dis àle‏ كالتصميم 
الإداري» وتصميم الرسومات. والعمل الحاسوبي تتزايد هي الأخرىء في حين أن الوظائف التي 
تتطلب معرفة متخصصة ”ال مهارات المتوسطة“ والتي تم تطبيقها مرارًا وتكرارًا مع بعض التكيف» 
هي الوظائف الأكثر عرضةً للاختفاء. ففي بعض الأحيان تتداخل التقنية في نفسها. فعلى سبيل 
OI gaas IBM Watson los G JEL‏ إمكانات أولية للبدء في طرح الأسئلة التي يمكن 
أن يطلبها أحد متخصصي التحليلات من مخزن البيانات» ومن الواضح. أنها تُقدم إجابات. وبا طثل, 
فإن التحليلات الأخرى - كعروض الخدمات - قد تؤدي إلى تقليل عدد الأشخاص الذين يحتاجون 
إلى الكفاءة عند استخدام برامج التحليلات. 


ويشير تقرير ذي إيكونوميست إلى أنه حتى لو مم يحل الذكاء الاصطناعي محل العمال 
بشكل مباشرء فإن الأمر سوف يتطلب منهم بالتأكيد اكتساب مهارات جديدة ليظلوا قادرين 
على المنافسة. كما أن تعطل السوق دائمًا ما يكون غير مريح. وسوف توفر السنوات القليلة 
المقبلة فرضًا ممتازة لمتخصصي التحليلات لتشكيل المستقبل. وفي القسم التالي سوف نحدد بعض 
السمات العامة لمتخصص علم البيانات. 
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الآثار غير المقصودة للتحليلات: 


إلى جانب القضايا التي ناقشناها بالفعل فيما يتعلق بالخصوصية, والأخلاقيات» والأمان, والآثار 
الشخصية / التنظيمية للتحليلات» يجب أن يكون المديرون وال مختصون بعلم البيانات على دراية 
بالآثار الاجتماعية طويلة الأجل للنماذج. وقد قدم كتاب صدر Cathy O'Neil.) 555a‏ )2016( 
هذه الحجج بشكل جيد للغاية مما لاقى انتشارًا في الأخبار. وقد حصلت 0727611 على الدكتوراه 
في الرياضيات من جامعة هارفارد 1136954 وعملت في مجال التمويل وصناعة علم البيانات. وقد 
دفعتها تجاربها وملاحظاتها إلى كتابة كتاب مشهور بعنوان أسلحة تدمير الرياضيات 06 18/205 
:Math Destruction‏ كيف تزيد البيانات الضخمة من عدم المساواة وتهدد الدهوقراطية. ونحن 
ندعوك لقراءة الكتاب» أو على الأقل الاطلاع على موقع مدونتها .https://mathbabe.org/ ze‏ 
وإلى جانب الترويج لكتابهاء فإن موقع المدونة يسلط الضوء على القضايا الاجتماعية التي تتعلق 
بالتحليلات. كما يمكنك الاطلاع على ملخص / استعراض جيد للكتاب عبر هذا الموقع: http://‏ 
-knowledge.wharton.upenn.edu/article/rogue-algorithms-dark-side-Big-data/‏ 

وتعتقد 0371 في كتابهاء بأن النماذج يجب أن تستوف ثلاثة شروط. فالعديد من النماذج 
الرياضية ليست شفافة. فإذا كان النموذج غير مفهوم» فإن تطبيقه يمكن أن يؤدي إلى عواقب 
غير مقصودة. ثانيّه يجب أن يتسم النموذج بأهداف واضحة قابلة تلقياس الكميء مثل التطبيق 
المشهور للتحليلات في كتاب وفيلم كرة امال للهطتز»عه80: وقد كان الهدف من هذا النموذج 
هو زيادة عدد مرات الفوز. وقد كانت مقاييس المدخلات المقترحة من العمر يمكن فهمها 
كذلك. بدلا من استخدام قاعدة التشغيل اب معلنة والأكثر شيوعًا في قياس (RBI)‏ والتي اقترحها 
الملل واستخدمت في النسب الأساسية والتدابير الأخرى (التي تم حسابها بسهولة وفهمها بسهولة 
من قبل أي شخص لديه مهارات الرياضيات الأساسية). ومن ناحية أخرىء فإن النماذج التي 
بني لتقييم مخاطر الأوراق المالية المدعومة بالرهن العقاري حيث لا يفهم أحد تمامًا الافتراضات 
الأساسية سوى المتداولين الماليين؛ حيث كانوا يتداولون الأوراق امالية المضمونة على نطاق واسع 
وذلك لأنهم قادوا الأزمة المالية في عام .۲٠١۸‏ أما الشرط الثالث فهو أن النماذج يجب أن تكون لها 
آلبة تصحيح ذاتي وعملية في المكان بحيث يتم تدقيق النماذج بانتظام» كما يجري النظر باستمرار 
في المدخلات والمخرجات الجديدة. وهذه المسألة الثالثة تعد بالغة الأهمية في تطبيق النماذج في 
الأماكن الاجتماعية. ومن ناحية أخرى فإن النماذج تديم الفرضيات الخاطئة الكامنة في مرحلة 
النمذجة الأولية. وتناقش yal O'Neil‏ من المواقف في هذه الحالة. فمثلاه تُستخدم في الولايات 
المتحدة لتحديد المدرسين ذوي الأداء الضعيف ومكافأة المعلمين الأفضل. وقد استخدمت هذه 
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النماذج درجات اختبار تلاميذهم. وتروي 071611 العديد من الأمثلة التي استخدمت النماذج 
لتسريح المعلمين «ضعيفي الأداء» على الرغم من أن هؤلاء المعلمين كانوا محبوبين من قبل الطلاب 
وأولياء الأمور. وتستشهد 0711 أيضًا بمثال آخر تتزايد أهميته في العديد من المنظمات» وهو 
أداء العمال؛ حيث يتم استخدام النماذج لتحسين جدولة العمال à‏ العديد من المنظمات. às‏ 
العديد من الحالات» يتم تطوير هذه الجداول لتتوافق مع تغيرات الطلب الموسمية واليومية, 
إلا أن 02011 تأسف لحقيقة أن هذه النماذج لا تأخذ في الاعتبار الآثار الضارة لهذا التفاوت 
في الجذاول على أسز هؤلاء العمال ذوي الدخل المنخفض. وهناك أمثلة أخرى من هذا القبيل 
تشمل نماذج تقييم درجة الاثتمان والتي تستند على ملامح تاريخية وبالتالي فإنها قد تؤثر GL.‏ 
على الأقليات. وبدون وجود آليات لتدقيق هذه النماذج وآثارها غير المقصودة, فإننا قد نضر أكثر 
مما ننفع على المدى الطويل. ولذلك؛ فإن متخصص علم البيانات يحتاج إلى إدراك هذه المخاوف. 
أسئلة مراجعة على القسم 5-8: 
-١‏ اذكر آثار التحليلات على اتخاذ القرار. 
۲- اذكر آثار التحليلات على المهام الإدارية الأخرى. 
*- قم بوصف الوحدات التنظيمية الجديدة التي أنشئت بسبب التحليلات. 
-٤‏ حدد أمثلة أخرى لتطبيقات التحليلات لإعادة تصميم مساحة العمل أو سلوك الفريق. 
-٥‏ كيف تؤثر الحوسبة الإدراكية على هيكل الصناعة؟ 
1- ما هي الوظائف التي من المرجح أن تتغير نتيجة التحول للآلية؟ 
/- ادرس تقرير ذي إيكونوميست (2016 ,5]820386) المذكور في هذا القسم. ما هي الآثار 

الأخرى للآلية؟ وهل وجدتها مثيرة للاهتمام؟ 
۸ عالم البيانات كمهنة: 

عام البيانات هو دور أو وظيفة مرتبطة في كثير من الأحيان بالبيانات الضخمة. وقد أصبح 
هذا الدور من أكثر الأدوار المطلوبة في السوق. وفي مقال نُشر في عدد أكتوبر ۲١٠۲‏ من مجلة 
Harvard Business Review‏ ]12 3 العالمان gle D. J. Patil «Thomas H. Davenport‏ 
وظيفة عاط البيانات بأنها ”الوظيفة الأكثر جاذبية في القرن .”١‏ وقد حددوا في تلك المقالة علماء 
البيانات الأساسيين» والأكثر مهارة عالمية» إضافة إلى من لديهم القدرة على كتابة التعليمات البرمجية 
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(بأحدث لغات ومنصات البيانات الضخمة). وعلى الرغم من أن هذه المهارات المذكورة قد تصبح 
في المستقبل القريب أقل دقة خاصة عندما يحمل العديد من الأشخاص لقب «عاط البيانات» على 
بطاقات العمل الخاصة بهم غير أنها تبدو في وقتنا الراهن بأنها أكثر المهارات الأساسية المطلوبة 
من علماء البيانات. وستكون أكثر المهارات استمرارية هي حاجة علماء البيانات إلى التواصل بلغة 
يفهمها جميع أصحاب المصلحة. بالإضافة إلى حاجتهم لإظهار المهارات الخاصة التي تتضمن سرد 
القصص مع البيانات» سواء أكان ذلك شقهيًا و / أو بصريًاء )2012 Davenport, Patil,‏ 

يستخدم علماء البيانات مزيجًا من مهاراتهم الخاصة بالأعمال بالإضافة إلى مهاراتهم الفنية 
لدراسة البيانات الضخمة؛ بحنًّا عن طرق لتحسين ممارسات تحليلات الأعمال الحالية (من وصفي إلى 
تنبّؤي وتوجيهي) ومن ثم تحسين القرارات من أجل فرص الأعمال الجديدة. ومن أكبر الاختلافات 
بين عام البيانات ومُستّخدم ذكاء الأعمال مثل محلل الأعمالء هو أن عاط البيانات يدرس ويبحث عن 
قدرات جديدة» في حين أن مُستخدم ذكاء الأعمال يقوم بتحليل حالات الأعمال والعمليات الحالية. 

كما يُعد الفضول الشديد هو أحد الصفات الغالبة والمتوقعة من علماء البيانات» بمعنى وجود 
رغبة عند علماء البيانات للتعمق في المشكلة وعدم تناولها بسطحية, بالإضافة إلى العثور على 
الأسئلة في صميمهاء واستخلاصها إلى مجموعة شديدة الوضوح من الفرضيات التي يمكن اختبارها. 
وهذا يستلزم في كثير من الأحيان التفكير الجماعي الذي بميز العلماء الأكثر إبداعًا في أي مجال. 
فعلى سبيل ال مثال» نحن نعرف عام بيانات يدرس مشكلة الاحتيال والذي أدرك أنها تتشابه مع 
نوع من المشاكل الخاصة بتسلسل الحمض النوويء )2012 OSE s83 (Davenport, Patil,‏ 
هذا العام هو وفريقه من صياغة حل يقلل من خسائر الاحتيال بشكل كبيرء وذلك من خلال 
الجمع بين تلك العوام المتفاوتة. 
من أين يأتي علماء البيانات؟ 

على الرغم من وجود بعض الخلاف حول استخدام العلم في الاسم؛ غير أن هذا الأمر أصبح أقل 
إثارة للجدل. ويستخدم علماء حقيقيون أدوات صنعها clle‏ آخرون» كوسيلة لتوسيع ا معرفة أو 
يقومون بصنعها إذا لم تكن موجودة. وهذا هو بالضبط ما يُتوقّع القيام به من قبل علماء البيانات. 
فعلى سبيل المثال» ينبغي على علماء الفيزياء التجريبية تصميم المعدات» وجمع البيانات» وإجراء 
تجارب متعددة لاكتشاف المعرفة وتوصيل نتائجها. وعلى الرغم من أن علماء البيانات قد لا يرتدون 
معاطف بيضاء فضلًا عن أنهم قد لا يعيشون في بيئة معملية معقمة. إلا أن ما يفعلونه بالضبط 
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يتمثل في: استخدام الأدوات والأساليب الإبداعية لتحويل البيانات إلى معلومات قابلة للتطبيق لكي 
يستخدمها الآخرون لاتخاذ قرارات أفضل. 

الجدير بالذكر أنه لا يوجد إجماع حول الخلفية التعليمية التي ينبغي أن تكون لدى عام 
البيانات. غير أنه عادةً ما يكون المرشح لذلك من أمثال: حاملي ماجستير (أو دكتوراه) في علوم 
الحاسب الآليء أو نظم المعلومات الإدارية (38115). أو الهندسة الصناعيةء أو درجات الدراسات 
التحليلية المشهورة الحديثة. وعلى الرغم من أن كل ذلك قد يكون ضروريًا إلا أنه ليس كافيًا 
لى يطلق على أحد الأشخاص أنه عام بيانات. فمن أهم الخصائص التي ينبغي توافرها في عام 
البيانات هي الخبرة الفنية فضلًا عن الخبرة بمجالات تطبيقات الأعمال. وبهذا المعنى» فإن هذا 
الدور يشبه الأدوار المهنية للمهندس أو الأدوار المهنية لإدارة المشاريع. حيث يتم تقبيم الخبرة 
بمقدار (إن لم يكن أكثر من) المهارات التقنية والخلفية التعليمية. ولن تكون مفاجأة كبيرة أن 
نرى في غضون السنوات القليلة القادمة شهادة مصممة لعلماء البيانات بشكل خاص (ربما يُطلق 
عليها اسم ”محترف علم البيانات“ أو ”58“ للاختصار). 

ونظرًا لأن هذا الدور هو مهنة لمجال لا يزال قيد التعريفء فإن العديد من ممارسات 
هذه المهنة لاتزال تجريبية كما أنها بعيدة عن أن تكون موحدة. وبالتالي» فإن الشركات تكون 
شديدة الحساسية فيما يتعلق بِبّعْد الخبرة لعالم البيانات. وبنضج هذه المهنة» وا ممارسات 
الموحدة: فإن التجربة ستكون أخف من المشكلة عند تعريف عام البيانات. وفي الوقت 
الحاضرء فإن الشركات تبحث عن الأشخاص ذوي الخبرة الواسعة في العمل مع البيانات المعقدة 
الذين حظوا بالتوظيف الجيد من بين أولئك الذين لديهم خلفيات تعليمية وعملية في العلوم 
الطبيعية أو الاجتماعية. وقد كان بعض أفضل وأمع علماء البيانات حاصلين على الدكتوراه 
في مجالات مقصورة على فئة معينة مثل علم البيئة وبيولوجي ا النظم Davenport, Patil,)‏ 
2. وعلى الرغم من عدم وجود إجماع حول المكان الذي يأتي منه علماء البيانات» إلا أن 
هناك فهمًا مشتركًا للمهارات والصفات المتوقع توافرها في ble‏ البيانات. ويوضح الشكل (A-A)‏ 
Jle Elo Gas‏ المستوى لهذه المهارات. 
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A-A JSA‏ المهارات التي تحدد عام البيانات 
فمن المُتوقع أن يكون لدى عام البيانات مهارات شخصية مثل الإبداع. والفضولء وتبادل 
ا معلومات / العلاقات بين الأشخاصء والخبرات الخاصة بالمجال» وتعريف المشكلة. والإدارة (تظهر في 
أشكال سداسية خضراء الخلفية في أعلى الجانب الأيسر من الشكل) فضلًا عن مهارات فنية سليمة 
مثل معالجة البيانات» والبرمجة / القرصنة / البرمجة النصية» والإنترنت ووسائل التواصل الاجتماعي 
/ تقنيات الشبكات (تظهر في أشكال سداسية ذات خلفية رمادية أسفل يمين الشكل). وتدور رؤية 
فنية )١1-8(‏ حول الإعلان عن وظيفة نموذجية لعام البيانات. 
رؤية فنية VA‏ 
وظيفة نموذجية لعلماء البيانات 

تبحث [بعض الشركات] عن عام بيانات لينضم إلى فريق تحليلات البيانات الضخمة لدينا. 

ومن المتوقع أن يكون كل فرد في هذا الدور مستعدًا للعمل كمهندس برامج, وباحث كمي. 

وسوف يكون للمرشح المثالي اهتمام كبير في دراسة شبكة اجتماعية عبر الإنترنت وشغف 

لتحديد الأمئلة التي تساعدنا في تشكيل أفضل المنتجات بالإضافة إلى الإجابة عن هذه الأسئلة. 
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المسؤوليات: 

- العمل عن كثب مع فريق هندسة المنتجات لتحديد الأسئلة المهمة عن المنتج 
والإجابة عليها. 

- الإجابة على الأسئلة المتعلقة بالمنتجات باستخدام الأساليب الإحصائية المناسبة 
على البيانات المتاحة. 


- نقل النتائج لمديري ومهندسي الإنتاج. 

- إدارة مجموعة البيانات الجديدة وتحسين مصادر البيانات الموجودة. 

- تحليل وتفسير نتائج تجارب المنتج. 

- تطوير أفضل الممارسات للآجهزة والتجريب ونقل ذلك إلى فرق هندسة المنتجات. 

المتطلبات: 

- الحصول على ماجستير أو دكتوراه في أحد المجالات الفنية ذات الصلة. أو أن يكون 
لديه أكثر من © سنوات من الخبرة في bass‏ صلة بهذا المجال. 

- خبرة واسعة في حل المشكلات التحليلية باستخدام الأساليب الكمية. 


- التعاون في المعالجة البارعة وتحليل البيانات المعقدة ذات الحجم الكبير والبعد 
العالي من مصادر مختلفة. 


- وجود شغف قوي للبحث التجريبي والإجابة عن الأسئلة الصعبة باستخدام البيانات. 
- منهج تحليلي مرن يسمح للنتائج مستويات متفاوتة من الدقة. 

- القدرة على توصيل التحليل الكمي المعقد بطريقة واضحة. ودقيقةء وقابلة للتطبيق. 
- الطلاقة في استخدام لغة برمجة نصية واحدة على الأقل مثل -PHP 5| Python‏ 
- الإهام بقواعد البيانات العلائقية و1[ 50. 

- الخبرة المعرفية بأداة تحليل مثل ۸» أو 5i .Matlab‏ 545. 


خبرة في العمل مع مجموعات كبيرة من البيانات, بالإضافة إلى الخبرة في العمل مع 
أدوات الحوسبة المقسمة $265 (eJ! Hive Hadoop .MapReduce) |J]‏ 
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ونادرًا ما يكون هناك أشخاص يتمتعون بهذه المجموعة من المهارات» مما يفسر سبب النقص 

في عدد علماء البيانات. وبسبب زيادة الطلب على هذه الفئة من الأفراد الأقل نسبيًاء تكون 
رواتب البداية لعلماء البيانات أعلى بكثير من ستة أرقام (بالدولار الأمريكي). أما الأشخاص الذين 
لديهم خبرة واسعة: بالإضافة إلى أنهم يملكون خبرة في مجال معينء فإن رواتبهم أعلى من ذلك 
بكثير. وفي معظم المنظمات» سيكون من الضروري بناء فريق من الأشخاص الذين لديهم هذه 
المهارات بشكل جماعي بدلا من البحث عن أفراد يتمتعون بهذه القدرات» وفيما يلي بعض 
التصريحات الحديثة حول علماء البيانات: 
- يقوم علماء البيانات بتحويل البيانات الضخمة إلى قيمة ضخمة: حيث يقدمون المنتجات التي 

تُرضي المستخدمين كما يُقدمون الأفكار التي تُخبر بقرارات الأعمال. 
- إن عاط البيانات ليس بارعًا في التعامل مع البيانات فحسب. بل إنه يُقدر أيضًا البيانات نفسها 

كأصل لا يُقدر بثمن. 
- بحلول عام 7٠٠١‏ سيكون هناك 6,0 مليون وظيفة جديدة لعلم البيانات» والتي لن يتم شَغْل 

سوى ثلثها فقط نظرًا لعدم توافر الأشخاص لشَّغْل هذه الوظائف. 
- علماء البيانات اليوم هم أساطير الأسواق المالية في الثمانينيات. 

إن استخدام علماء البيانات لا يقتصر على شركات الإنترنت ذات التقنية العالية. فالعديد 

من الشركات التي لا تمتلك الكثير من التواجد على الإنترنت هي أيضًا مهتمة بمتخصصي تحليلات 
البيانات الضخمة المؤهلين تأهيلًا عاليًا. وفي giy‏ فإن ذلك هو المجال الذي يشهد الكثير 
من النمو. وبالطبع» وكما لوحظ à‏ الكتاب عدة مراتء فإن فرص تنظيم المشاريع لا تزال 
موجودة لتطوير التطبيق التالي «القاتل» والذي من شأنه أن يُحدث فرقًا كبيرًا لإحدى المنظمات 
والمستفيدين منها وبالتالي تجعلك غنيًا ومشهورًا. 


أسئلة مراجعة على V-A eI‏ 

-١‏ ما هو عام البيانات؟ وما سبب زيادة الطلب عليه؟ 

؟- ما هي الخصائص المشتركة لعلماء البيانات؟ وأي من هذه الخصائص يُعد أكثرها أهمية؟ 
*- من أين يأق علماء البيانات؟ وما هي الخلفيات التعليمية التي لديهم؟ 

-٤‏ في رأيك» ما هو الطريق لكي تصبح عاًا عظيمًا في البيانات؟ 
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تلخيص لأهم نقاط الفصل: 

- تستطيع البيانات الجغرافية أن تعزز تطبيقات التحليلات عن طريق دمج معلومات المكان. 

- يمكن التنقيب في معلومات موقع المستخدمين الحالي لتطوير الحملات الترويجية التي تستهدف 
مستخدم معين في الوقت المناسب. 

- يمكن استخدام معلومات المكان من أجهزة الجوال لإنشاء ملفات تعريف لس لوك وحركة 
المستخدم. تكن مثل هذه المعلومات الخاصة بمكان المستخدمين من إيجاد أناس آخرين ذوي 
اهتمامات ومعلنين متشابهين لتكييف عروضهم الترويجية. 

- تستطيع أيضًا التحليلات المبنية على المكان أن تفيد المستهلكين بشكل مباشر وليس الشركات 
فقط. ويتم تطوير تطبيقات الجوال لتمكين مثل هذه التطبيقات للتحليلات الابتكارية. 

- يعتبر إنترنت الأشياء (101) المنحنى الأسامي القادم لنمو علم التحليلات / البيانات. ويطلق 
عليه البعض Lal‏ الإنترنت الصناعي. 

- تنمو تطبيقات (101) في كل صناعة Le‏ في ذلك التطبيقات الطبية والتصنيع والطاقة والملاحة الجوية. 

- تعتبر إحدى الفئات الشائعة لتطبيقات (101) هى الصيانة التنبؤية لتخفيض وقت توقف 
المعدات غير الضروري وإجراء الصيانة / الإصلاحات المطلوبة قبل استلزامها. 

- تقدم الحوسبة السحابية إمكانية استخدام البرمجيات والأجهزة والمنصات والبنية التحتية, dS‏ 
بحسب اشتراكه. كما تمكن الحوسبة السحابية المستخدم من استثمار أكثر قابلية للتطوير. 

- تقدم الخدمات التحليلية القائمة على الحوسبة السحابية إلى المنظمات أحدث التقنيات دون 
استثمار معنوي مسبق. 

- تستطيع التحليلات التأثير على المنظمات بطرق كثيرة. كأنظمة مستقلة أو متكاملة فيما بينهاء 
أو مع أنظمة معلومات أخرى قائمة على الحوسبة. 

- يتفاوت تأثير التحليلات على الأفراد. فقد يكون إيجابيًا أو محايدًا أو سلبيًا: 

- قد يصاحب تقديم أنظمة ذكية ظهور قضايا قانونية جديّة. وتعتبر المسؤولية والخصوصية 
مجالي المشاكل ال مهيمنة. 

- يمكن توقع الكثير من الآثار الاجتماعية الإيجابية من التحليلات» والتي تتراوح من توفير فرص 
للمعاقين إلى قيادة الحرب ضد الإرهاب. ومن المحتمل تحسن جودة الحياة في كل من العمل 
والمنزل» كنتيجة للتحليلات. وبالطبع يكون هناك أيصًا قضايا تحتاج للاهتمام. 
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- إن نمو التحليلات سوف يؤدي إلى تغيرات جوهرية في هيكل الصناعة ومستقبل التوظيف. 
- تكمن المعركة الكبرى حول من يمتلك جميع بيانات المستخدم التي يتم إنشاؤها من استعمال 
الهواتف الذكية والسيارات وما إلى ذلك. 


مصطلحات أساسية: 





الحوسبة السحابية نظم المعلومات الجغرافية (615) | إنترنت الأشياء (101) 








| الخصوصية‎ (RFID) goll Shai cisel 





أسئلة للمناقشة: 

-١‏ ما هي الفوائد المحتملة من استخدام البيانات الجغرافية المكانية في التحليلات؟ مع ضرب أمثلة. 

۲- ما هي أنواع التطبيقات الجديدة التي يمكن أن تظهر من معرفة المواقع الفورية للمستخدمين؟ 
وماذا لو كنت تعرف أيضًا ماذا يحملون في سلة تسوقهم مثلا؟ 

- كيف يمكن أن يستفيد المستهلكون من استخدام التحليلات» لا سيما القائمة منها على معلومات المكان؟ 

-٤‏ ناقش العبارة التالية: «يعتبر إنشاء ملفات التعريف القائم على تتبع المكان قويًا ولكنه أيضًا 
يضع تهديدات للخصوصية». 

0- هل تعتبر الحوسبة السحابية «مجرد منتج قديم أعيد تغليفه بعبوة جديدة»؟ وكيف تتشابه 
مع المبادرات الأخرى؟ وكيف تختلف؟ 

1- ناقش العلاقة بين أجهزة الجوال والشبكات الاجتماعية. 

۷- يدعي البعض أن التحليلات بشكل عام تفرغ الأنشطة الإدارية من الإنسانيةء ويعترض آخرون 
على هذا الادعاء. ناقش براهين كل من وجهتي النظر هاتين. 

6- إن تشخيص العدوى ووصف الأدوية هما نقاط ضعف العديد من الأطباء الممارسين (وفقًا J‏ 
16و50 .11 .8: أحد مطوري 8050127). ولذا؛ يبدو أنه سيكون من الأفضل للمجتمع 
أن يتم استخدام أنظمة تشخيص مبنية على التحليلات من قبل المزيد من الأطباء. أجب عن 
الأسئلة التالية: 

-١‏ في رأيك لماذا يتم استخدام مثل هذه الأنظمة بالحد الأدنى من JS‏ الأطباء؟ 
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-٠١‏ افترض أنك مدير مستش فى ويتبع لك الأطباء الذين يتقاضون رواتبهم منها. ماذا ستفعل 
لإقناعهم باستخدام النظام؟ 
*- إذا كانت الفوائد المحتملة للمجتمع عظيمة جدّاء فهل يستطيع هذا المجتمع أن يفعل 
شيئًا يزيد من استخدام الأطباء لمثل هذه النظم التحليلية؟ 

؟- اذكر بعض مخاوف الخصوصية الرئيسة المتعلقة باستخدام التحليلات على بيانات الجوال؟ 

-٠‏ اذكر حالات جديدة للتعديات على خصوصية المستخدم وتأثيراتها على علم البيانات كمهنة. 

تمارين: شبكة جامعة تيراداتا )10[N(‏ وغيرها من التمارين اليدوية: 

- اذهب إلى terdatauniversitynetwork.com‏ وابحث عن دراسات الحالة. قم مشاهدة 
فيديو 851 عن حالة الركاب الذين تم انقطاع الاتصال بهم والذين قد تكون رأيتهم أثناء قراءة 
الفصل الأول. ما هي التطبيقات الجديدة التي يمكنك تخيلها مستوى البيانات التفصيلية التي 
يمكن لشركات الطيران التقاطها اليوم؟ 

«teradatauniversitynetwork.com (Jos -‏ اذهب إلى مكتبة الحلقات الصوتية. 
قم بإيجاد حلقات صوتية عن ذكاء الأعمال واسعة الانتشار والمقدمة -Hugh Watson (ya‏ 
قم بتلخيص النقاط المعروضة من قبل المتحدث. 

- اذهب إلى teradatauniversitynetwork.com‏ وابحث عن مقاطع فيديو 851. استعرض 
هذه المقاطع وأجب عن أسئلة الحالة المرتبطة بها. 

- توفر المجموعات المبنية على تتبع المكان احتمال الخدمات الشخصية ولكن يتحدى الخصوصية. قم 
بتقسيم الصف إلى فريقين للتناظر أحدهما «مع» والآخر «ضد» هذه التطبيقات. 

- حدد القضايا الأخلاقية المرتبطة باتخاذ القرارات الإدارية. ابحث على الإنترنت» وانضم إلى مجموعات 
/ المدونات المناقشة» واقرأً المقالات من الإنترنت» ثم قم بإعداد تقرير عن النتائج الخاصة بك. 

- ابحث على الإنترنت لإيجاد أمثلة لكيفية قيام نظم التحليلات بتس هيل أنش طة مثل التفويضء 
والتخصيص الشامل» والعمل الجماعي. 

- ابحث في مركز موارد التقنية الخاص بجمعية ث8 !لİفمريكıة abanet.org/tech/Itrc/techethics.)‏ 
.nolo.com 3545 (html‏ ما هي الاهتمامات القانونية والمجتمعية الرئيسة والمتقدمة التي تمت 
معالجتها هناك؟ وكيف يتم التعامل معها؟ 
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- قم باستكشاف عدة مواقع مرتبطة بالرعاية الصحية (مثل (who.intg WebMD.com‏ أوجد 
القضايا المتعلقة بالتحليلات والخصوصيةء ثم اكتب تقريرًا عن الكيفية التي تعمل بها هذه 
المواقع على تحسين الرعاية الصحية. 

- قم بزيیlرةö‏ مدونة [oT Ecosystem‏ الlخlصة‏ ڊ_ http://mattturck. e Matt Turck‏ 
JS Ue 4o. .com/2016/03/28/2016-iot-landscape/‏ شرکتین فیما لا يقل عن قطاعين 
رأسيين وقطاعين أفقيين. اذهب إلى مواقع الويب الخاصة بهاتين الشركتين وقم بإعداد تقرير 
عن عروضهما ونجاحات العملاء. 

- ادخل على 56.6012نا ]ناملا وابحث عن مقاطع فيديو عن الحوسبة السحابيةء وقم مشاهدة 
اثنين على الأقل من هذه المقاطع. لخّص النتائج الخاصّة بك. 

- ادخل على 230018.013 واكتشف كيف تستطيع إنشاء ومشاركة موسيقى مع الأصدقاء. 
zal‏ ستكشف كيف يحلل ال موقع تفضيلات ١‏ مستخدم. 

- ادخل على 111111833726.6012 واستعرض دراسات حالة متنوعة وقم بتلخيص أحد التطبيقات 
المثيرة من أجهزة الاستشعار في فهم التبادلات الاجتماعية في المنظمات. 

- يعد الهدف من هذا التمرين هو تعريفك بإمكانيات الهواتف الذكية لتحديد النشاط البشري. 
archive.ics.uci.edu/ml/datasets/Human-Activ : Je ázlis O6L.Jl ác sazxa 03535‏ 
ity - Recognition Using4Smartphones‏ 


- إنها تحتوي على قراءات التسارع وضابط الاتجاهات (البوصلة الدوارة) لثلاثين فردًا يضعون 
الهاتف الذي في حزام يلتف حول وسطهم. تكون البيانات متاحة في صورتها الخام وتتضمن 
بعض جهود تجهيز البيانات» ويكون هدفك هو تحديد وتصنيف هذه القراءات إلى أنشطة 
كالمشي والجري وتسلق الجبالء وما إلى ذلك. ويتوفر المزيد من المعلومات عن مجموعة 
البيانات à‏ صفحة التنزيل. ويمكنك استخدام التجميع من أجل الاستكشاف dad‏ واكتساب 
فهم البيانات. كما يمكنك استخدام أدوات مثل ۸ لتجهيز وتحليل هذه البيانات. 
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تم التصميم والإخراج الفني والطباعة في 


الإدارة العامة للطباعة والنشر - معهد الإدارة العامة ١٤٤٠ھ‏ 


هذا الكتاب: 

تطوّر مصطلح التحليلات إلى مصطلحات حديثة أخرىء مثل علم البيانات» وهو 
IONS‏ العميق وإنترنت الأشياء إذ تقوم أغلب المنظمات - سواء خاصة أو 
عامة - بإنشاء وحدات تنظيمية جديدة تركّز على التحليلات التي تدعم صُناع القرار 
معلوماتيًا وتسهم في رفع كفاءة وفعالية عملياتها؛ وذلك بالاعتماد على أحدث الأدوات 
المعلوماتية الذكية. مثل ذكاء الأعمال. والذي يستخلصٌ المعلومات بطريقة مبتكرة مز 
تيارات البيانات المتنوعة. 








يُقدّم هذا الكتاب منظوراً إداريًا لتحليلات الأعمال في ثمانية فصولء تبدأ بنظرة عامة 
على ذكاء الأعمالء والتحليلات. وعلم البيانات» ثم ينتقل إلى التحليلات الوصفية وتتضمّن 
طبيعة البياناتء والنمذجة الإحصاتية. وتصوير البيانات» وذكاء الأعمال. ومستودعات 
البيانات ومصطلحات حديثة. مثل: بحيرات البيانات, متبوعة بالتحليلات التنبؤية وتتضمّز 
عملية وطرق وخوارزميات التنقيب في البيانات, وتحليلات النص والويب ووسائل التواصل 
الاجتماعيء ويليها التحليلات التوجيهية. مثل الأمثلية والمحاكاة. ثم استعراض المفاهيم 
والأدوات الأساسية للبيانات الضخمة:. وينتهي الكتاب بالتعرّف على الاتجاهات المستقبلية 

















والخصوصية والاعتبارات الإدارية ف التحليلات. 


EEE EEN ا‎ EEE EEE S 
مستوياتهم وتخصصاتهم؛ مما جعله من الكتب الرائدة في السوق. وقد ميّزت هذه الطبعة‎ 
المنقحة من هذا الكتاب بالشمولية والوضوح وسهولة الاستخدام وتقديم مواد دقيقة‎ 
ومُحدَّثة غير متوفرة في أيّ نض آخر؛ إضافة للشرح التفصياي المع رز بحالات وأمثلة من‎ 
عام الواقع» مثل أفضل الممارسات لتوظيف الأفراد الأذكياء للأدوات المعلوماتية لتحسين‎ 
الأداء والعلاقات في منظمات الأعمال والحكومات والمنظمات غير الرّبحية؛ مما ارنقى‎ 
ل ا ل‎ E psal sna JJ] oUSUG 
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